Ciao ragazzi, io ho dei testi che son composti da html, testi che non mi servono e altro cod, mi servirebbe estrarre solo le parti di tetso che si trovano ad esempio tra i tag
testo che devo estrarre </p>. Come posso fare? Grazie
Ciao ragazzi, io ho dei testi che son composti da html, testi che non mi servono e altro cod, mi servirebbe estrarre solo le parti di tetso che si trovano ad esempio tra i tag
testo che devo estrarre </p>. Come posso fare? Grazie
5ym0
Puoi usare:
- le funzioni di manipolazione delle stringhe (strpos(), substr(), etc.)
- le espressioni regolari (preg_match(), etc.)
- Tidy + DOM
- Tidy + SAX
Ok, potresti farmi un esempio semplice per favore? Poi mi guardo in dettaglio le varie cose che mi hai suggerito. Grazie
5ym0
Facciamo così, tu guardi nel dettaglio le cose che ti ho suggerito e fai delle prove.
Se poi le prove non funzionano, posti il codice che hai creato e descrivi il comportamento che ottieni e quello che vorresti ottenere.
va bene allora domani con calma le guardo, provo poi ti faccio sapere, grazie ciao.
5ym0
Ciao, allora ho capito un po come funziona nel senso che son riuscito ad estrarre del tetso che mi serviva, adesso ho un altro problema ovvero: devo estrarre dei link e li prendo da una lista di href="/A/...resto del link" dove A sta per la sezione, quindi ho usato questo codice:
in questo modo mi estrae il link come serve a me ma, prende solo l'ultimo che trova, cioè se ce ne son 100 mi stampa solo il centesimo...come posso fare per fargli stampare un link per volta?Codice PHP:
echo preg_replace('/(.*)\<a href=\"\/A\/(.*?)\\"(.*)/','\\2',$htmlcode);
5ym0
Ti suggerisco di iniziare leggendo il manuale ufficiale:
http://www.php.net/preg_match_all