Salve,
volevo sapere se è possibile impedire ai web crawler di scaricare i file (.pdf .avi .zip etc) che risiedono in una cartella specifica.
Grazie.
Salve,
volevo sapere se è possibile impedire ai web crawler di scaricare i file (.pdf .avi .zip etc) che risiedono in una cartella specifica.
Grazie.
Puoi farlo con il file robot.txt, cerca con Google.
se metto i file nella cartella "public"?
non cambia nulla. La cartella public ha la sola particolarità di avere, di solito, i permessi di scrittura.
Incollalo in un file .txt, chiamalo robots.txt e mettilo nella root principale del sitocodice:User-agent: * Disallow: /tua-cartella/
User-agent: * (significa tutti gli spider)
Disallow: /public/ (impedisce agli spider di indicizzare la cartella public.
la cosa non è comunque affidabile:Originariamente inviato da lucavizzi
Incollalo in un file .txt, chiamalo robots.txt e mettilo nella root principale del sitocodice:User-agent: * Disallow: /tua-cartella/
User-agent: * (significa tutti gli spider)
Disallow: /public/ (impedisce agli spider di indicizzare la cartella public.
ho giusto un problema "serio" a riguardo
se proprio il file non deve essere rintracciato è bene che stia in una cartella senza permessi di navigazione (tipo quella del DB)
edit:
urca... mi accorgo solo ora di non aver chiuso la directory con /
sarà quello?
'mo provo
E' la prima volta che sento che non è affidabile.
edit:
mi sa che è quello
come ho editato forse ho fatto io un errore
comunque la stessa google non garantisce
Strumenti per i webmaster di google:
http://www.google.com/support/webmas...t&answer=93708Utilizza un file robots.txt per controllare l'accesso ai file e alle directory sul tuo server. Il file robots.txt è come un segnale elettronico di divieto di accesso. Indica a Google e agli altri crawler i file e le directory sul tuo server che non devono essere sottoposti a scansione.
si si.. se rispettano le istruzione non entrano,
questo SE decidono di seguire le istruzioni
ora, G, cerca di essere coerente...
non il robot non da obblighi, solo "consigli"