Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 12

Discussione: REGEX per mail

  1. #1

    REGEX per mail

    Ciao, ho una serie di file di testo con del testo dentro, all'interno di questo testo ci sono degli indirizzi mail... io avrei bisogno di recuperare questi ultimi.

    vorrei fare qualcosa tipo

    codice:
    $ cat testo | grep [regex] >> elenco.mail
    ma come la costruisco una regex cosi'? inoltre devo usare grep o zgrep? sempre che sia la strada giusta.
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

  2. #2
    bash non lo conosco molto bene, io userei python....
    codice:
    #!/usr/env python
    import re
    target = re.compile(r'[a-z\-\.]+@+[a-z\-\.]+', re.IGNORECASE)
    e_file = open('tuo_file', 'w')
    for lines in e_file.readlines():
    	for word in lines::
    		if re.search(target, word):
    			print word
    		else:
    			pass
    non l'ho provato, potrebbe esserci qualche errorino...
    PyGTK GUI programming
    un impegno concreto: eliminare la k dalle tastiere italiane

  3. #3
    provo, ma testalo prima!:

    cat TESTO | grep '.+@(.+\.)+[com|net|it|org]' >>email

    se non mi sono sbagliato troppo questo ti seleziona tutte le righe cone dentro qualcosa del tipo
    nome@qualcosa.qualcosa.qualcosa.qualcosa.com o .net o .it o .org ecc.. con un numero qualunque di 'qualcosa'

    chissà se ti può servire
    @_=(115,-17,6);print+map{chr$_[$.=$_-$_]*$_**$.+++$_[$.]*$_**$.+++$_[$.]*$_**$.}$.-$...$#_

  4. #4


    Sono riuscito a fare questo:

    a) sono sicuro che la mail inizia con info@

    quindi

    $ egrep 'To: info@+([a-z])+.+(it|org|net|com|fm)' ciao.mbox > hello

    cosi' pero' riesco ad isolare la riga, ma non l'indirizzo mail pulito
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

  5. #5
    Originariamente inviato da Mutato


    cosi' pero' riesco ad isolare la riga, ma non l'indirizzo mail pulito
    per quello dovresti usare python
    PyGTK GUI programming
    un impegno concreto: eliminare la k dalle tastiere italiane

  6. #6
    se nella regex ci metti un bel paio di:
    \/ ..... \/
    dopo puoi riferirti a ciò che è contenuto lì in mezzo con \1
    xò i dettagli esatti al momento non te li so dire, mi deimentico sempre e ogni volta che lo faccio mi rileggo il man
    cmq se gli dai un'occhio si capisce rapidamente come fare
    @_=(115,-17,6);print+map{chr$_[$.=$_-$_]*$_**$.+++$_[$.]*$_**$.+++$_[$.]*$_**$.}$.-$...$#_

  7. #7
    Originariamente inviato da adarkar
    provo, ma testalo prima!:

    cat TESTO | grep '.+@(.+\.)+[com|net|it|org]' >>email

    se non mi sono sbagliato troppo questo ti seleziona tutte le righe cone dentro qualcosa del tipo
    nome@qualcosa.qualcosa.qualcosa.qualcosa.com o .net o .it o .org ecc.. con un numero qualunque di 'qualcosa'

    chissà se ti può servire
    Ottimo si', stavo scrivendo il mio msg e in effetti e' il problema che avevo!!
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

  8. #8
    Originariamente inviato da adarkar
    se nella regex ci metti un bel paio di:
    \/ ..... \/
    dopo puoi riferirti a ciò che è contenuto lì in mezzo con \1
    xò i dettagli esatti al momento non te li so dire, mi deimentico sempre e ogni volta che lo faccio mi rileggo il man
    cmq se gli dai un'occhio si capisce rapidamente come fare
    eh eh ..

    Belle le regex, e' praticamente la prima volta che le uso. Sono riuscito a isolare splendidamente quello che volevo, un bel unique, e un bel sort e ho il mio elenco ...

    Se questo lavoro va in malora ora ho uno strumento per lo spam! Pazzesco.

    Python mi fa in[a-z]re perche' usa i TAB... dopo aver perso un lavoro da 300 linee di codice solo perche' ho fatto la ca[a-z]ta di cambiare editor ho giurato a me stesso di non usarlo piu'.
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

  9. #9
    La comunità Python italiana si dispiace di aver perso uno dei suoi utilizzatori

    Niente fiori ma opere di bene




    grattati un pò ... ehehhe
    scherzo ovviamente, ciao
    PyGTK GUI programming
    un impegno concreto: eliminare la k dalle tastiere italiane

  10. #10
    Originariamente inviato da KornShell
    grattati un pò ... ehehhe
    scherzo ovviamente, ciao
    No, no. Mi devo grattare forte. Con Python ho sempre avuto una sfiga mortale... pero', ammetto, e' un ottima calcolatrice!

    >>> Media = 29.19
    >>> Tesi = (Media*11)/3
    >>> print Tesi

    Una vera figata
    Are you alive?
    No, but I was written with LOVE. A new scripting language.
    www.frequenze.it

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.