my @parole = split(/ /, $each);
my @parole = split(/\s+/, $each);
Usando ambedue questi casi, non mi divide alcuni spezzoni di testo tipo "a where you can get answers to your".. il perl li considera parola unica, perchè ?!?!
my @parole = split(/ /, $each);
my @parole = split(/\s+/, $each);
Usando ambedue questi casi, non mi divide alcuni spezzoni di testo tipo "a where you can get answers to your".. il perl li considera parola unica, perchè ?!?!
a me funziona perfettamente, sei sicuro che la frase non contenga caratteri speciali?
Marco Allegretti
shishii@tiscalinet.it
Lang: PERL, PHP, SQL.
Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips
Ho scoperto che c'è un altro modo non interpretato da perl per fare lo spazio. Con \s non funziona, / / nemmeno, copiando e incollando tale carattere nel sorgente funziona!
Ma non capisco che carattere sia
allora probabilmente il sorgente e la fonte da cui prelevi la frase sono in codifica diversa tipo utf8 e iso-8859-1
prova ad usare nel sorgente all'inizio:
#!/usr/bin/perl
use utf8;
Marco Allegretti
shishii@tiscalinet.it
Lang: PERL, PHP, SQL.
Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips
nel caso per fare la conversione automatica come posso fare ?
la conversione delle codifiche non è una cosa banale e comporta pericoli. Sotto Linux c'è un tool da linea di comando che si chiama "recode"
Marco Allegretti
shishii@tiscalinet.it
Lang: PERL, PHP, SQL.
Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips
e nel caso di documenti prelevati dal web conosci qualche altro sistema ?
prova a vedere se questo modulo ti serve:
http://search.cpan.org/~mthurn/I18N-...18N/Charset.pm
Marco Allegretti
shishii@tiscalinet.it
Lang: PERL, PHP, SQL.
Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips
ho scoperto che a generare quei caratteri strani era HTML::Entities
Ora non lo uso più e si è risolto