Parser per la trasformazione al volo di una pagina in testo

**webstyler** · 25-05-2004, 17:59

Ciao, cerco un parser che prenda una pagina e ne restituisca una versione esclusivamente testuale, esattamente come questo :
http://betsie.sourceforge.net/

però in php..

ho cercato ma senza trovare nulla di interessante ..

conoscete qualcosa ?

thks

**Gianni_T** · 25-05-2004, 18:37

guarda quì:
http://it2.php.net/manual/en/function.strip-tags.php

**phoenixweb** · 25-05-2004, 19:11

Se vuoi una via "grezza" puoi usare tranquillamente striptags.
Conta però che ti toglierà tutti gli "a capo" (
) e qualunque arricchimento del testo (corsivo, grassetto e quant'altro!).

Ti consiglio di fare una funzioncina con le regular expression che ti toglie tutti i tag html tranne alcuni (es. tutti tranne [b], [i],
, etc..).

Ciao

**webstyler** · 25-05-2004, 19:18

no, strip_tags la conosco, però cercavo qualcosa di più complesso, magari una classe o uno serie di funzioni e condizioni che permetta di trasformare una pagina .. come da link postato.

in realtà il termine "esclusivamente testuale" non è corretto, io devo poter trasformare una pagina qualsiasi in una pagina che possa "essere letta dai sistemi di lettura" o meglio in una pagina "accessibile"...

il link postato punta ad un progetto free, con 1 file pl che è il parser .. un file da 1500 righe con molti controlli e che restituisce una versione pulita della pagina...

**webstyler** · 26-05-2004, 09:05

nada ?

Discussione: Parser per la trasformazione al volo di una pagina in testo

Strumenti discussione

Ricerca discussione

Visualizza

Parser per la trasformazione al volo di una pagina in testo

Permessi di invio