Visualizzazione dei risultati da 1 a 2 su 2
  1. #1
    Utente di HTML.it
    Registrato dal
    Mar 2019
    Messaggi
    1

    [PYTHON] Scraping di valore variabile (aggiornato da JavaScript) in una pagina HTML

    Buongiorno a tutti,
    mi chiamo Leonardo e sto imparando sia python che html.
    Vorrei estrarre un parametro testo che non è fisso, cioè si aggiorna ogni secondo circa.
    La parte di testo dovrebbe all'interno di un javascript code che è presente nel sorgente html.
    Il parametro è quello cerchiato in rosso nell'immagine sottostante.
    ispeziona.PNG
    Posizionandosi sopra in modalità ispeziona compare questo (sono diversi perchè si è aggiornato nel frattempo):
    trx.PNG

    ho notato che se, sulla classe evidenziata in blu nella prima immagine, faccio tasto destro->copy-> copy outerHTML ed incollo in testo ottengo diversi dati, fra cui quello che serve a me.
    Esiste un'istruzione per estrarre "outerHTML"?
    Grazie
    Immagini allegate Immagini allegate

  2. #2
    Se il testo in questione deriva dall'esecuzione di Javascript (che realisticamente lo va a pescare con una qualche richiesta HTTP) non puoi fare scraping "ignorante" dal solo HTML - o di fatto usi un browser che esegue "per davvero" la pagina e recuperi il contenuto del nodo DOM a runtime, oppure devi studiare il Javascript che viene usato dalla pagina e riprodurre tu da Python quello che fa lui da JS per recuperare i dati.
    Amaro C++, il gusto pieno dell'undefined behavior.

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.