Visualizzazione dei risultati da 1 a 2 su 2
  1. #1

    Aiuto per trattare stringhe

    Ciao ragazzi,

    Ho raccolto circa 1800 stringhe di testi in un db e ora devo proseguire con alcune analisi linguistiche.
    Per esempio devo contare le parole di ogni stringa e poi fare la media. Per fare questo io ho deciso di "normalizzare" i testi raccolti. Spiego: volevo contare le parole utilizzando la funzione explode basandomi sugli spazi di una stringa(ho visto che esisteva una funzione apposita ma non mi prende i numeri che spesso ci sono). Per utilizzare questa cosa, devo inoltre togliere la punteggiatura, i famosi cuoricini(che spesso comapiono su facebook) etc in modo che ogni stringa sia disposta in questo modo: parola parola parola parola (ovvero uno spazio tra una parola e l'altra senza punteggiatura). Ora io avevo trovato una funzione che eliminava la punteggiatura ma essendoci tra le stringhe anche url non me le riconosceva e le spaccava, inoltre essendoci anche emoticon del dipo i due punti mi venivano tolti e rimaneva solo la D. Ora il mio problema è: eliminare dalle stringhe la punteggiatura, le emoticon, lasciare inalterate le url presenti nella stringa. tutto ciò in modo da avere struttura della stringa uguale a: parola parola parola

    Come posso fare??

  2. #2
    Utente di HTML.it
    Registrato dal
    Apr 2004
    Messaggi
    3,709
    mah.. potresti per esempio fare così:

    Codice PHP:
    // suppongendo che $testo contiene la stringa da elaborare
    // contenuti da eliminare:
    $eliminare = array(
      
    'http://',
      
    ':D',
      
    ':',
      ...
    );
    $testo str_replace($eliminare''$testo); // elimina tutti i contenuti "speciali" 
    in $eliminare puoi mettere tutto quello che vuoi avendo l'accortezza di inserire prima le stringhe più lunghe quando contengono una parte comune (p.es. prima "http://" e ":D" e dopo ":")

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.