[c#] preleva codice HTML da wikipedia

**zn666** · 15-06-2010, 00:14

Il mio problema in sintesi è: prelevare il codice HTML da wikipedia mi da errore

codice:

HttpWebRequest request = (HttpWebRequest)WebRequest.Create("http://www.google.it/");
            
            // Set some reasonable limits on resources used by this request
            request.MaximumAutomaticRedirections = 4;
            request.MaximumResponseHeadersLength = 4;
            // Set credentials to use for this request.
            request.Credentials = CredentialCache.DefaultCredentials;
            HttpWebResponse response = (HttpWebResponse)request.GetResponse();

            // Get the stream associated with the response.
            Stream receiveStream = response.GetResponseStream();

            // Pipes the stream to a higher level stream reader with the required encoding format. 
            StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8);

            string codicehtml =readStream.ReadToEnd();
            response.Close();

è uno script che ho trova in giro su internet... l'ho provato cambiando il campo url con un indirizzo di wikipedia per esempio
"http://it.wikipedia.org/wiki/Riven-_il_seguito_di_Myst"

non so come mai ma adesso mi da errore di accesso negato 403 e (inevitabilmente) il programma si ferma

non ne sono troppo sicuro, ma se non sbaglio oggi pomeriggio facendo prove, non mi ha dato questo errore... cioè l'errore me lo da adesso, perchè? oggi pomeriggio mi connettevo da una casa di un mio amico (alice 7 Mega) mentre adesso sono ad alessandria (Alice 20 mega). non riesco a credere che sia la linea che mi da questo errore, ma è l'unica cosa che ho cambiato

codice:

Spero che qualcuno tra voi possa aiutarmi ed illuminarmi sul problema... magari è solo una cavolata che non riesco a vedere perchè sono troppo stanco. lol spero di no

PS: facendo una ricerca in questo forum prima di postare ho trovato questo script, ma mi da comunque lo stesso errore

codice:

string url = "http://www.google.it/";
            string response = "";

            HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(url);
            using (Stream stream = request.GetResponse().GetResponseStream())
            {
                using (StreamReader reader = new StreamReader(stream))
                {
                    response = reader.ReadToEnd();
                }
            }

**oregon** · 15-06-2010, 08:15

Prova ad inserire uno user agent valido, ad esempio

codice:

request.UserAgent = "Mozilla/5.0 (X11; U; Linux i686; pl-PL; rv:1.9.0.2) Gecko/20121223 Ubuntu/9.25 (jaunty) Firefox/3.8";

**LeleFT** · 15-06-2010, 09:39

Spostata la discussione nel forum corretto.

Ciao.

**xnavigator** · 15-06-2010, 12:07

rubare i contenuti da wiki non è bello

**oregon** · 15-06-2010, 13:20

Originariamente inviato da xnavigator
rubare i contenuti da wiki non è bello

I siti sono "pubblici". Ciò che è pubblico, per definizione, non si può rubare.

**xnavigator** · 15-06-2010, 13:39

copiare il contenuto per metterlo sul proprio sito e casomai guadagnarci con la pubblicità = rubare

**zn666** · 15-06-2010, 13:42

Originariamente inviato da LeleFT
Spostata la discussione nel forum corretto.

Ciao.

chiedo scusa... ho visto programmazione... e non sono andato avanti nelle sottocategorie

Originariamente inviato da xnavigator
rubare i contenuti da wiki non è bello

Questo "rubare" da Wiki è solo la parte di un mio programma che ho intenzione di creare... ma ti assicuro che se il programma non lo facesse automaticamente, qualcuno altro lo farebbe manualmente... creando questa applicazione semplifico la vita

Originariamente inviato da oregon
Prova ad inserire uno user agent valido, ad esempio

codice:

request.UserAgent = "Mozilla/5.0 (X11; U; Linux i686; pl-PL; rv:1.9.0.2) Gecko/20121223 Ubuntu/9.25 (jaunty) Firefox/3.8";

ti dirò, cosa mi è successo stamattina:
1. lo provo e non va, dando lo stesso errore
2. inserisco la riga di codice che mi hai suggerito e funziona!!!(grazie)

3. tolgo la riga di codice, e mi funziona lo stesso

...
4. però poi, provo a riavviare la connessione e non mi funziona più, reinserisco la riga che mi hai suggerito e funziona...

credo di avere un idea del perché solo la prima volta per ogni connessione richiede "request.Agent"... ma non sono un esperto, perciò forse sparerei cavolate

ti ringrazio tantissimo per il suggerimento, spero che non mi crei più problemi questa parte

**xnavigator** · 15-06-2010, 13:44

Originariamente inviato da zn666
Questo "rubare" da Wiki è solo la parte di un mio programma che ho intenzione di creare... ma ti assicuro che se il programma non lo facesse automaticamente, qualcuno altro lo farebbe manualmente... creando questa applicazione semplifico la vita

si certo come no.
hai chiesto almeno l'autorizzazione a wiki per prendere tutti i suoi contenuti?

**oregon** · 15-06-2010, 13:57

Originariamente inviato da xnavigator
copiare il contenuto per metterlo sul proprio sito e casomai guadagnarci con la pubblicità ...

Stai allargando il concetto ... fino a quando si diceva "prelevare HTML da wikipedia" allora non si parla di illecito ...

Altrimenti, non è "rubare", ma sicuramente è un atto illecito ...

Attenzione a quello che si dice ...

**zn666** · 15-06-2010, 13:59

Originariamente inviato da xnavigator
si certo come no.
hai chiesto almeno l'autorizzazione a wiki per prendere tutti i suoi contenuti?

vedo che la buona fede non esiste -.-
mi dispiace che non mi crediate... non devo fare un sito internet e rubare informazioni...
mi serve solo prelevare la tabella in alto a destra che c'è in quasi tutte le pagine riferite a film, anime o giochi

per farlo ho già predisposto alcune funzioni che in generale utilizzano queste due righe qua sotto, ma dalle "belle" parole di prima dubito che mi crederete

codice:

string[] sep = new string[] {"<table class=\"sinottico\"","</table>"};
string[] ris = codicehtml.Split(stringSeparators, StringSplitOptions.RemoveEmptyEntries);

continuo a rispondere anche se mi date del ladro perchè voglio farvi capire che non cerco di creare un programma che in automatico mi scarichi tutta l'enciclopedia... quando finirei il programma potrei farvelo anche vedere, ma comunque non mi credereste perchè direste che ne ho fatto uno apposta solo per non farmi dare del ladro...

in sintesi: è inutile continuare questa conversazione fortemente OT, perchè anche se vi dessi tutte le prove del mondo che non intendo rubare l'enciclopedia, voi potreste comunque dire che sto mascherando le mie vere intenzioni accusandomi di altre cose che non ho mai fatto.

Quel sinottico, per esempio, è periodicamente ogni giorno prelevato da forse migliaia di utenti per creare release nei forum warez. è un atto illecito che viene ripetuto ogni giorno o l'enciclopedia è fatta apposta per avere informazioni?

Discussione: [c#] preleva codice HTML da wikipedia

Strumenti discussione

Ricerca discussione

Visualizza

[c#] preleva codice HTML da wikipedia

Moderazione

Re: Moderazione

Re: Re: Moderazione

Permessi di invio