Visualizzazione dei risultati da 1 a 4 su 4
  1. #1
    Utente di HTML.it L'avatar di lnessuno
    Registrato dal
    Feb 2002
    Messaggi
    2,732

    Analizzare sorgenti pagina html, in python

    Dunque, ho una pagina web molto semplice con il meteo della mia città, giorno per giorno per tutta la settimana:

    http://www.ilmeteo.it/meteo.php?citta_input=cuneo


    vorrei farmi uno scriptino in python che, all'avvio del computer (ma su questo mi arrangio da solo) mi vada ad aprire questa pagina, si vada a cercare i valori che servono e li salvi, formattati un pò meglio, in un file di testo. (al posto delle immagini metterei un link ad una immagine messa in un altra directory del mio hd)
    Detta così sembrerebbe una cosa banale, e probabilmente lo è per uno che sa usare decentemente il python... per me invece è un casino

    non so da dove incominciare, come faccio a dire a python "vai alla riga n. 15, cerca fra i <td> il giorno della settimana, poi alla riga n. 18 cerca...


    qualcuno sa dove posso prendere un manuale? ho guardato su internet ma non ho trovato niente che possa fare al caso mio, qualche manuale (anche ben fatto) l'ho trovato, ma la gestione di stringhe di pagine web proprio non l'ho vista...

  2. #2
    Per Prima Cosa Dovresti fare una Funzioncina che Scarichi la Pagina che ti interessa e la salvi sul tuo HD...

    Poi dovresti leggere il file riga per riga...In C si usa fgets() ma in Python non lo so...

    Ma comunque ti converrebbe trovare un riferimento piuttosto che il numero di riga...
    Per riferimento intendo una stringa che indentifichi univocamente quello che vuoi...

    http://programmazione.html.it/python/
    PoWered by:
    Gentoo 1.5.3 - Kernel 2.6.7
    Debian Sid - Kernel 2.6.7 - Bash 3.0
    Slackware current - Kernel 2.6.7

  3. #3
    Utente di HTML.it L'avatar di lnessuno
    Registrato dal
    Feb 2002
    Messaggi
    2,732
    grazie della risposta e del link

    di riferimenti in quella pagina non ne ho molti (hai visto il sorgente? è di una piattezza incredibile, saranno 200 caratteri in tutto ed è tutto uguale dall'inizio alla fine )
    per questo che ho pensato che fosse meglio usare il numero della riga

    in python so che si può controllare una pagina direttamente dal server, quindi scaricarla mi servirebbe a poco (ho già fatto una cosa simile, però come dici te usando dei riferimenti)

    non so proprio da dove iniziare

  4. #4
    Vediamo se ti posso essere d'aiuto.

    Per connetterti alla pagina e leggerne il contenuto senza salvare niente su hdd puoi fare:
    codice:
    #!/usr/bin/env python
    
    import urllib
    
    data = urllib.urlopen("http://www.ilmeteo.it/meteo.php?citta_input=cuneo")
    print data.read()
    ora qui ho fatto stampare l'output della pagina sulla shell, tu invece devi cercare i valori che ti servono, magari utilizzando delle regexp (modulo re).

    ciao
    ksh
    PyGTK GUI programming
    un impegno concreto: eliminare la k dalle tastiere italiane

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.