Visualizzazione dei risultati da 1 a 5 su 5
  1. #1
    Utente di HTML.it L'avatar di alkat
    Registrato dal
    Jan 2004
    Messaggi
    4,197

    conteggio parole, caratteri...

    ciao,
    mi sembra di ricordare che ci sia un comando che permette di contare le parole e i caratteri (magari con e senza spazi) contenuti nei vari tipi di file di testo (.sxw, .rtf, .txt, .doc, ecc... anche html?) direttamente da shell; esiste? qual è?

    .a.

  2. #2
    Utente bannato
    Registrato dal
    Jan 2003
    Messaggi
    1,414
    codice:
    [maiosyet]@[alcibiade]-[~] wc --help
    Usage: wc [OPTION]... [FILE]...
    Print newline, word, and byte counts for each FILE, and a total line if
    more than one FILE is specified.  With no FILE, or when FILE is -,
    read standard input.
      -c, --bytes            print the byte counts
      -m, --chars            print the character counts
      -l, --lines            print the newline counts
      -L, --max-line-length  print the length of the longest line
      -w, --words            print the word counts
          --help     display this help and exit
          --version  output version information and exit
    
    Report bugs to <bug-coreutils@gnu.org>.
    [maiosyet]@[alcibiade]-[~]
    Dovrebbe essere questo

  3. #3
    Utente di HTML.it L'avatar di alkat
    Registrato dal
    Jan 2004
    Messaggi
    4,197
    sì, il comando è quello... però dà risultati assurdi!

    se conto le parole dello stesso testo con wc e con abiword ottengo questo:

    wc: 701
    abiword: 596

    e uno dice, "vabbe', sbaglia solo di un centinaio di parole (!)"

    però se calcolo i caratteri:
    wc: 23040
    abiword: 3860 (spazi inclusi)

    e poi le linee:
    wc: 13
    abiword: 68

    mi sa che c'è qualcosa che non va...

    .a.


    Edit: bello il nome della tua linux box! ;o)

  4. #4
    Originariamente inviato da alkat
    sì, il comando è quello... però dà risultati assurdi!
    [...]
    mi sa che c'è qualcosa che non va...
    Il confronto non ha granche` senso AFAIK. Il fatto e` che, a quanto ne so, abiword usa una-cosa-tipo-xml-forse-proprio-xml per salvare i file, in modo da potergli (e gestire) dare una struttura.
    Conseguentemente, il conteggio delle parole/caratteri terra` conto delle informazioni di struttura, revisione (metadati, in geenere), e NON li conteggera`.
    wc considera invece l'input come file di testo e conta bruttamente tutto.
    E` piu` che lecito aspettarsi che, con queste premesse, il conto non torni.
    "Qualsiasi esperto ha paura di combattere usando la katana vera. Anch'io. Ma non ignoro la mia paura, riesco ad accettarla, e a metterla da parte accanto a me".

  5. #5
    Utente di HTML.it L'avatar di Sym81
    Registrato dal
    Jan 2002
    Messaggi
    114
    Si, usa proprio xml
    "Dream on
    Do you believe...all the things that you are seeing are true?
    The Start's where the End's leading you
    Do you believe...all's as twisted as one would perceive?
    Seek the Answer and soon you'll believe"

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2019 vBulletin Solutions, Inc. All rights reserved.