PDA

Visualizza la versione completa : Estrapolare documenti da un sito internet.


MikX
06-03-2014, 21:11
Ho trovato questo link: http://www.tfc.it/File/Tabelle/07L-308Win.xls

dal quale è possibile scaricare quel file XLS, ora però quel file è solo una parte di tanti altri file con nomi diversi che non conosco, ma che vorrei scaricare.

ovviamente ho già provato a digitare http://www.tfc.it/File/Tabelle/ (http://www.tfc.it/File/Tabelle/07L-308Win.xls)

ma non porta a nulla....

sapete qualche modo per avere l'elenco di ciò che contiene quella cartella Tabelle?

Boolean
07-03-2014, 11:13
Google dorks.

nel campo di ricerca di google:

inurl:www.tfc.it/File/Tabelle/

poi clicca su "Includi risultati omessi"

:ciauz: Boolean

carlo2002
07-03-2014, 11:17
Eccezionale, al secondo posto compare questo topic :zizi:

MikX
07-03-2014, 11:23
molto interessante.. grazie

Alhazred
07-03-2014, 11:40
Sarà molto interessante, ma compare solo il file che hai già trovato tu.

Vuol dire che questa ricerca non trova le cose che non vuoi che si vedano o che non c'è altro nella cartella?

Boolean
07-03-2014, 11:50
Sarà molto interessante, ma compare solo il file che hai già trovato tu.

Come dicevo, devi cliccare il link per ripetere la ricerca, includendo risultati omessi (i quali essendo simili vengono nascosti dalla prima ricerca)

partime
07-03-2014, 11:51
Sarà molto interessante, ma compare solo il file che hai già trovato tu.

Vuol dire che questa ricerca non trova le cose che non vuoi che si vedano o che non c'è altro nella cartella?


Bisogna cliccare su "ripetere la ricerca includendo i risultati omessi" e allora compaiono molti più risultati.

Alhazred
07-03-2014, 11:54
Però la trovo una cosa molto scorretta da parte di Google, se non faccio apparire dei risultati è perché non voglio che appaiano.

LeleFT
07-03-2014, 12:53
Però la trovo una cosa molto scorretta da parte di Google, se non faccio apparire dei risultati è perché non voglio che appaiano.

Ehm... l'operatore "inurl:" cerca nel database di google, tutti i risultati che contengono quell'url. Se i documenti compaiono, significa che sono presenti nel DB di Google... e se sono presenti nel DB di Google significa che il crawler di Google li ha trovati e se il crawler li ha trovati, significa che:

1) non sono stati nascosti dal webmaster.

oppure

2) il webmaster non sa fare il suo mestiere.

:)

Ciao. :ciauz:

lnessuno
07-03-2014, 12:53
Se non vuoi che appaiano devi dirlo a google

http://www.robotstxt.org/

Loading