Visualizzazione dei risultati da 1 a 8 su 8
  1. #1
    Utente di HTML.it
    Registrato dal
    Jun 2003
    Messaggi
    207

    Cattura codice HTML non autorizzata

    Ho creato un programma che cattura il codice HTML delle pagine di cui gli passo l'indirizzo, usando WebRequest e WebResponse. Accade però che per alcuni siti mi venga restituito il codice di errore 401 sebbene aprendo lo stesso indirizzo con qualunque browser la pagina si vede perfettamente. Coma mai accade questo? I gestori del sito riescono ad accorgersi che la richiesta proviene da un programma e non da un browser? Come si può impostare il server in modo che si accorga di questo?

  2. #2
    Utente di HTML.it L'avatar di GabbOne
    Registrato dal
    Mar 2006
    Messaggi
    577
    La sparo li ..
    è possibile per un server leggere lo User Agent del client che richiede la risorsa. Tenendo conto che nello User Agent viene specificato anche il tipo di browser che ha effettuato la richiesta allora è possibile per un server effettuare un taglio sulle richieste in ingresso.

    Ovviamente non so se ti trovi in questo caso specifico.


  3. #3
    Utente di HTML.it L'avatar di pietro09
    Registrato dal
    Jan 2002
    Messaggi
    10,116
    si può avere il link ad un sito simile in modo da fare delle prove?

    Pietro

  4. #4
    Utente di HTML.it
    Registrato dal
    Jun 2003
    Messaggi
    207
    Originariamente inviato da pietro09
    si può avere il link ad un sito simile in modo da fare delle prove?

    A me non funziona con DeaStore, ad esempio con questa pagina: http://www.deastore.com/libro/letter...806200169.html

  5. #5
    Utente di HTML.it L'avatar di pietro09
    Registrato dal
    Jan 2002
    Messaggi
    10,116
    aveva ragione GabbOne

    è bastato aggiungere alla richiesta

    request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; rv:7.0.1) Gecko/20100101 Firefox/7.0.1"

    e funziona perfettamente
    Pietro

  6. #6
    Utente di HTML.it
    Registrato dal
    Jun 2003
    Messaggi
    207
    Funziona! Grazie!!!

  7. #7
    Originariamente inviato da GabbOne
    La sparo li ..
    è possibile per un server leggere lo User Agent del client che richiede la risorsa. Tenendo conto che nello User Agent viene specificato anche il tipo di browser che ha effettuato la richiesta allora è possibile per un server effettuare un taglio sulle richieste in ingresso.

    Ovviamente non so se ti trovi in questo caso specifico.

    e hai sparato bene.
    Alcuni siti controllano le richieste per bloccare alcuni (o tutti) i robot di scanning.
    Per superare questo controllo, bisogna effettuare una richiesta simulando alla perfezione un client browser.
    Consiglio di installare un tool per verificare le richieste e le risposte HTTP
    Esempio LiveHTTPHeaders per FireFox

  8. #8
    Utente di HTML.it L'avatar di GabbOne
    Registrato dal
    Mar 2006
    Messaggi
    577
    sicuramente utile

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2026 vBulletin Solutions, Inc. All rights reserved.