Ciao, cerco un parser che prenda una pagina e ne restituisca una versione esclusivamente testuale, esattamente come questo :
http://betsie.sourceforge.net/
però in php..
ho cercato ma senza trovare nulla di interessante ..
conoscete qualcosa ?
thks
![]()
Ciao, cerco un parser che prenda una pagina e ne restituisca una versione esclusivamente testuale, esattamente come questo :
http://betsie.sourceforge.net/
però in php..
ho cercato ma senza trovare nulla di interessante ..
conoscete qualcosa ?
thks
![]()
[°_°] The Web Styler Project [°_°]
:.:Classifica Spettacolare :.:
:-:Partecipa :-: GUADAGNA SCRIVENDO ARTICOLI !! fino a 2,5 crediti per parola
Se vuoi una via "grezza" puoi usare tranquillamente striptags.
Conta però che ti toglierà tutti gli "a capo" (
) e qualunque arricchimento del testo (corsivo, grassetto e quant'altro!).
Ti consiglio di fare una funzioncina con le regular expression che ti toglie tutti i tag html tranne alcuni (es. tutti tranne [b], [i],
, etc..).
Ciao
no, strip_tags la conosco, però cercavo qualcosa di più complesso, magari una classe o uno serie di funzioni e condizioni che permetta di trasformare una pagina .. come da link postato.
in realtà il termine "esclusivamente testuale" non è corretto, io devo poter trasformare una pagina qualsiasi in una pagina che possa "essere letta dai sistemi di lettura" o meglio in una pagina "accessibile"...
il link postato punta ad un progetto free, con 1 file pl che è il parser .. un file da 1500 righe con molti controlli e che restituisce una versione pulita della pagina...
![]()
[°_°] The Web Styler Project [°_°]
:.:Classifica Spettacolare :.:
:-:Partecipa :-: GUADAGNA SCRIVENDO ARTICOLI !! fino a 2,5 crediti per parola
nada ?
![]()
[°_°] The Web Styler Project [°_°]
:.:Classifica Spettacolare :.:
:-:Partecipa :-: GUADAGNA SCRIVENDO ARTICOLI !! fino a 2,5 crediti per parola