Visualizzazione dei risultati da 1 a 9 su 9
  1. #1
    Utente di HTML.it
    Registrato dal
    Nov 2002
    Messaggi
    2,460

    splittare la frase in parole

    my @parole = split(/ /, $each);
    my @parole = split(/\s+/, $each);

    Usando ambedue questi casi, non mi divide alcuni spezzoni di testo tipo "a where you can get answers to your".. il perl li considera parola unica, perchè ?!?!

  2. #2
    a me funziona perfettamente, sei sicuro che la frase non contenga caratteri speciali?
    Marco Allegretti
    shishii@tiscalinet.it
    Lang: PERL, PHP, SQL.
    Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips

  3. #3
    Utente di HTML.it
    Registrato dal
    Nov 2002
    Messaggi
    2,460
    Ho scoperto che c'è un altro modo non interpretato da perl per fare lo spazio. Con \s non funziona, / / nemmeno, copiando e incollando tale carattere nel sorgente funziona!

    Ma non capisco che carattere sia

  4. #4
    allora probabilmente il sorgente e la fonte da cui prelevi la frase sono in codifica diversa tipo utf8 e iso-8859-1

    prova ad usare nel sorgente all'inizio:

    #!/usr/bin/perl

    use utf8;
    Marco Allegretti
    shishii@tiscalinet.it
    Lang: PERL, PHP, SQL.
    Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips

  5. #5
    Utente di HTML.it
    Registrato dal
    Nov 2002
    Messaggi
    2,460
    nel caso per fare la conversione automatica come posso fare ?

  6. #6
    la conversione delle codifiche non è una cosa banale e comporta pericoli. Sotto Linux c'è un tool da linea di comando che si chiama "recode"
    Marco Allegretti
    shishii@tiscalinet.it
    Lang: PERL, PHP, SQL.
    Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips

  7. #7
    Utente di HTML.it
    Registrato dal
    Nov 2002
    Messaggi
    2,460
    e nel caso di documenti prelevati dal web conosci qualche altro sistema ?

  8. #8
    prova a vedere se questo modulo ti serve:

    http://search.cpan.org/~mthurn/I18N-...18N/Charset.pm
    Marco Allegretti
    shishii@tiscalinet.it
    Lang: PERL, PHP, SQL.
    Linux user n° 268623 Fedora Core 10, Fedora Core 6, Debian Sarge on mips

  9. #9
    Utente di HTML.it
    Registrato dal
    Nov 2002
    Messaggi
    2,460
    ho scoperto che a generare quei caratteri strani era HTML::Entities

    Ora non lo uso più e si è risolto

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.