Salve, sono nuovo e volevo chiedervi una cosa: esiste un qualche modo per estrarre tutti i link (a href) da un file html in batch? Anche usando programmi esterni. Grazie!![]()
Salve, sono nuovo e volevo chiedervi una cosa: esiste un qualche modo per estrarre tutti i link (a href) da un file html in batch? Anche usando programmi esterni. Grazie!![]()
Che significa anche usando programmi esterni? Che l'operazione di estrazione può essere fatta in un qualsiasi linguaggio di programmazione, che poi viene richiamato tramite uno script batch?
Si, è possibile. Devi solo scrivere un programma con il linguaggio che preferisci, e poi avviare lo script in batch che lo richiama; però mi chiedo a che serva lo script batch in questo caso.
Il problema è che l'unico "linguaggio" che conosco è il batch, per programma esterno intendo un programma di parsing da linea di comando.
In solo batch dubito fortemente che sia possibile, né sono al corrente di programmi inclusi in Windows che facciano esclusivamente quello.
La soluzione corretta è usare un parser HTML (non le regex); ne esistono un certo numero, con binding per praticamente ogni linguaggio "vero" (batch non rientra nei linguaggi "veri"). Facendo una rapida ricerca con Google troverai già scritti una miriade di script già pronti (tipicamente in Python o in Perl - esempio) per fare il mestiere che chiedi.
Amaro C++, il gusto pieno dell'undefined behavior.