Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 14
  1. #1

    [c#] preleva codice HTML da wikipedia

    Il mio problema in sintesi è: prelevare il codice HTML da wikipedia mi da errore

    codice:
    HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://www.google.it/");
                
                // Set some reasonable limits on resources used by this request
                request.MaximumAutomaticRedirections = 4;
                request.MaximumResponseHeadersLength = 4;
                // Set credentials to use for this request.
                request.Credentials = CredentialCache.DefaultCredentials;
                HttpWebResponse response = (HttpWebResponse)request.GetResponse();
    
                // Get the stream associated with the response.
                Stream receiveStream = response.GetResponseStream();
    
                // Pipes the stream to a higher level stream reader with the required encoding format. 
                StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8);
    
                string codicehtml =readStream.ReadToEnd();
                response.Close();
    è uno script che ho trova in giro su internet... l'ho provato cambiando il campo url con un indirizzo di wikipedia per esempio
    "http://it.wikipedia.org/wiki/Riven-_il_seguito_di_Myst"

    non so come mai ma adesso mi da errore di accesso negato 403 e (inevitabilmente) il programma si ferma

    non ne sono troppo sicuro, ma se non sbaglio oggi pomeriggio facendo prove, non mi ha dato questo errore... cioè l'errore me lo da adesso, perchè? oggi pomeriggio mi connettevo da una casa di un mio amico (alice 7 Mega) mentre adesso sono ad alessandria (Alice 20 mega). non riesco a credere che sia la linea che mi da questo errore, ma è l'unica cosa che ho cambiato
    codice:
    s
    codice:
    s
    Spero che qualcuno tra voi possa aiutarmi ed illuminarmi sul problema... magari è solo una cavolata che non riesco a vedere perchè sono troppo stanco. lol spero di no

    PS: facendo una ricerca in questo forum prima di postare ho trovato questo script, ma mi da comunque lo stesso errore

    codice:
    string url = "http://www.google.it/";
                string response = "";
    
                HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);
                using (Stream stream = request.GetResponse().GetResponseStream())
                {
                    using (StreamReader reader = new StreamReader(stream))
                    {
                        response = reader.ReadToEnd();
                    }
                }

  2. #2
    Utente di HTML.it L'avatar di oregon
    Registrato dal
    Jul 2005
    residenza
    Roma
    Messaggi
    36,480
    Prova ad inserire uno user agent valido, ad esempio

    codice:
    request.UserAgent = "Mozilla/5.0 (X11; U; Linux i686; pl-PL; rv:1.9.0.2) Gecko/20121223 Ubuntu/9.25 (jaunty) Firefox/3.8";
    No MP tecnici (non rispondo nemmeno!), usa il forum.

  3. #3
    Moderatore di Programmazione L'avatar di LeleFT
    Registrato dal
    Jun 2003
    Messaggi
    17,320

    Moderazione

    Spostata la discussione nel forum corretto.


    Ciao.
    "Perchè spendere anche solo 5 dollari per un S.O., quando posso averne uno gratis e spendere quei 5 dollari per 5 bottiglie di birra?" [Jon "maddog" Hall]
    Fatti non foste a viver come bruti, ma per seguir virtute e canoscenza

  4. #4
    rubare i contenuti da wiki non è bello

  5. #5
    Utente di HTML.it L'avatar di oregon
    Registrato dal
    Jul 2005
    residenza
    Roma
    Messaggi
    36,480
    Originariamente inviato da xnavigator
    rubare i contenuti da wiki non è bello
    I siti sono "pubblici". Ciò che è pubblico, per definizione, non si può rubare.
    No MP tecnici (non rispondo nemmeno!), usa il forum.

  6. #6
    copiare il contenuto per metterlo sul proprio sito e casomai guadagnarci con la pubblicità = rubare

  7. #7

    Re: Moderazione

    Originariamente inviato da LeleFT
    Spostata la discussione nel forum corretto.


    Ciao.
    chiedo scusa... ho visto programmazione... e non sono andato avanti nelle sottocategorie

    Originariamente inviato da xnavigator
    rubare i contenuti da wiki non è bello
    Questo "rubare" da Wiki è solo la parte di un mio programma che ho intenzione di creare... ma ti assicuro che se il programma non lo facesse automaticamente, qualcuno altro lo farebbe manualmente... creando questa applicazione semplifico la vita

    Originariamente inviato da oregon
    Prova ad inserire uno user agent valido, ad esempio

    codice:
    request.UserAgent = "Mozilla/5.0 (X11; U; Linux i686; pl-PL; rv:1.9.0.2) Gecko/20121223 Ubuntu/9.25 (jaunty) Firefox/3.8";
    ti dirò, cosa mi è successo stamattina:
    1. lo provo e non va, dando lo stesso errore
    2. inserisco la riga di codice che mi hai suggerito e funziona!!!(grazie)
    3. tolgo la riga di codice, e mi funziona lo stesso ...
    4. però poi, provo a riavviare la connessione e non mi funziona più, reinserisco la riga che mi hai suggerito e funziona...

    credo di avere un idea del perché solo la prima volta per ogni connessione richiede "request.Agent"... ma non sono un esperto, perciò forse sparerei cavolate

    ti ringrazio tantissimo per il suggerimento, spero che non mi crei più problemi questa parte

  8. #8

    Re: Re: Moderazione

    Originariamente inviato da zn666
    Questo "rubare" da Wiki è solo la parte di un mio programma che ho intenzione di creare... ma ti assicuro che se il programma non lo facesse automaticamente, qualcuno altro lo farebbe manualmente... creando questa applicazione semplifico la vita
    si certo come no.
    hai chiesto almeno l'autorizzazione a wiki per prendere tutti i suoi contenuti?

  9. #9
    Utente di HTML.it L'avatar di oregon
    Registrato dal
    Jul 2005
    residenza
    Roma
    Messaggi
    36,480
    Originariamente inviato da xnavigator
    copiare il contenuto per metterlo sul proprio sito e casomai guadagnarci con la pubblicità ...
    Stai allargando il concetto ... fino a quando si diceva "prelevare HTML da wikipedia" allora non si parla di illecito ...

    Altrimenti, non è "rubare", ma sicuramente è un atto illecito ...

    Attenzione a quello che si dice ...
    No MP tecnici (non rispondo nemmeno!), usa il forum.

  10. #10
    Originariamente inviato da xnavigator
    si certo come no.
    hai chiesto almeno l'autorizzazione a wiki per prendere tutti i suoi contenuti?
    vedo che la buona fede non esiste -.-
    mi dispiace che non mi crediate... non devo fare un sito internet e rubare informazioni...
    mi serve solo prelevare la tabella in alto a destra che c'è in quasi tutte le pagine riferite a film, anime o giochi

    per farlo ho già predisposto alcune funzioni che in generale utilizzano queste due righe qua sotto, ma dalle "belle" parole di prima dubito che mi crederete

    codice:
    string[] sep = new string[] {"<table class=\"sinottico\"","</table>"};
    string[] ris = codicehtml.Split(stringSeparators, StringSplitOptions.RemoveEmptyEntries);
    continuo a rispondere anche se mi date del ladro perchè voglio farvi capire che non cerco di creare un programma che in automatico mi scarichi tutta l'enciclopedia... quando finirei il programma potrei farvelo anche vedere, ma comunque non mi credereste perchè direste che ne ho fatto uno apposta solo per non farmi dare del ladro...

    in sintesi: è inutile continuare questa conversazione fortemente OT, perchè anche se vi dessi tutte le prove del mondo che non intendo rubare l'enciclopedia, voi potreste comunque dire che sto mascherando le mie vere intenzioni accusandomi di altre cose che non ho mai fatto.

    Quel sinottico, per esempio, è periodicamente ogni giorno prelevato da forse migliaia di utenti per creare release nei forum warez. è un atto illecito che viene ripetuto ogni giorno o l'enciclopedia è fatta apposta per avere informazioni?

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.