PDA

Visualizza la versione completa : wget e nuovi file


Akiro
23-06-2008, 01:09
ciao,
non riesco a capire perch il seguente comando non mi scarica i nuovi file presenti ad un dato indirizzo.
Se lancio:

wget -r -k -p --no-parent www.pippo.tv/archive/*

mi aggiorna tutti i file che trova gi nella dir sul pc ma non recupera i nuovi file, pi recenti; in pratica se faccio un touch xxx-yyy (del nuovo file) nella dir del pc e lancio il comando effettua il download di tutti i file, compreso quello nuovo...

il formato dei nuovi file qualcosa del tipo /xxx-yyy (cui corrispondono xxx all'anno e yyy al mese numerico)

ps. l'asterisco finale obbligatorio altrimenti non scarica nulla.. da un "404"

sacarde
23-06-2008, 09:29
hai provato

--mirror

?



ma riesci a scaricare anche da cartelle da siti http in cui in genere e' negato l'accesso ?

Akiro
23-06-2008, 10:07
Originariamente inviato da sacarde
hai provato

--mirror

?



ma riesci a scaricare anche da cartelle da siti http in cui in genere e' negato l'accesso ?


stasera provo l'opzione.

scusa, ma in che senso negato l'accesso? cio se negato l'accesso di un url (che nemmeno il browser riesce ad aprire) non credo che possa scaricare qualcosa wget

sacarde
23-06-2008, 10:40
con l'html in una directory in genere apri index.html o index.php

in genere la visione dei file contenuti o dell'index della directory non e' permesso

Akiro
23-06-2008, 11:42
capito, si in genere non permesso farne il browse come lista di elementi, ma dipende molto da come configurato il web server, se reindirizzo la richiesta ad una directory o una pagine ad un index.html di default o almeno credo.

nel mio caso non ricordo se per fare il download delle pagine parte da un index.html che contiene tutti i link alle pagine /archive/
dovrei controllare cosa scarica come primo elemento

sacarde
23-06-2008, 12:00
se ci accedi da browser li vedi tutti i file della cartella?

Akiro
23-06-2008, 12:11
uhm no, restituisce un errore... quindi forse il comando sopra fa solo il refresh delle pagine su disco...

Akiro
28-06-2008, 01:07
Originariamente inviato da sacarde
hai provato

--mirror

?

provato... sembrerebbe scaricarlo ma non trovo i file su disco!



--01:03:10-- www.pippo.tv/archive/2008-06?from=0
=> `www.pippo.tv/archive/2008-06?from=0'
Connecting to www.pippo.tv [ip]:80... connected.
HTTP richiesta inviata, aspetto la risposta... 200 OK
Lunghezza: non specificato [text/html]
Manca l'header last-modified -- date disattivate.
--01:03:10-- www.pippo.tv/archive/2008-06?from=0
=> `www.pippo.tv/archive/2008-06?from=0'
Connecting to www.pippo.tv[ip]:80... connected.
HTTP richiesta inviata, aspetto la risposta... 200 OK
Lunghezza: non specificato [text/html]

[ <=> ] 127,723 25.55K/s

01:03:16 (25.51 KB/s) - `www.pippo.tv/archive/2008-06?from=0' saved [127,723]


davvero strano...

sacarde
28-06-2008, 09:12
forse ricrea tutto l'albero ?

Akiro
02-07-2008, 21:27
non so, l'ha ricreato ma non c'era traccia dei file...

http://www.pippo.tv/archive/* non comunque raggiungibile, speravo che wget riuscisse a scaricare i file di quell'indirizzo dalla home principale.

Loading