Ci vuole un sacco di tempo, perchè non serve a nulla leggere i file via ftp, ma si deve scadire tutti il sito... Non c'è un metodo più rapido?
Ci vuole un sacco di tempo, perchè non serve a nulla leggere i file via ftp, ma si deve scadire tutti il sito... Non c'è un metodo più rapido?
Se trovate la soluzione ditemelo, perchè io lo faccio a manina..![]()
E-mail marketing blog: consigli, casi pratici e discussioni sul mondo dell'e-mail marketing.
Offerte di lavoro SEO/SEM
Umh... si potrebbe velocizzare la scansione del sito creando una copia in locale, ma se il db è molto dinamico non serve.
Oppure si può prevedere il parametro solo_link accettato da tutte le pagine php del sito.
Se questo parametro è settato in get a 1 produco la pagina normalmente, ma invece di inviarla all'utente invio solo i link che essa contiene. Così risparmio in banda durante l'operazione di grab del sito (ovviamente devo riscrivere software che crea la sitemap).
Che ne pensate? soluzioni più efficienti?
Beh ... vi consiglio di utilizzare un CMS. Fa già tutto lui ...
Scusatemi in anticipo per gli ORRORI di ortografica, ma sono analfabeta
Electronic parts catalog
Gestione cataloghi ricambio IPC
Documentazione tecnica & manuali
Diemnticavo ... in alternativa scandire tutto il sito, intercettare gli href interni al sito, e "riconvertire" gli url.
Si puà fare con uno script il asp con un db di appoggio.
![]()
Scusatemi in anticipo per gli ORRORI di ortografica, ma sono analfabeta
Electronic parts catalog
Gestione cataloghi ricambio IPC
Documentazione tecnica & manuali
Come interecetti gli href? Intendi dire:
Controllo con script server side quali sono i file .php, eseguo il loro codice con una eval e leggo cosa restituirebbero, estraggo gli href e ottengo la lista di tutti i file del sito.
Intendi una cosa del genere?
NO, ti crei uno script che naviga le pagine come se fosse un motore di ricerca (quindi vede la pagine in modo "html"), e "scnanerizzi"/"scandisci" il codice html.
Scusatemi in anticipo per gli ORRORI di ortografica, ma sono analfabeta
Electronic parts catalog
Gestione cataloghi ricambio IPC
Documentazione tecnica & manuali
Ce l'ho già, ma non mi soddisfa va sempre in timeout e devo rieseguirlo 500.000 volte senza contare che succhia banda...[supersaibal]Originariamente inviato da CiodoF
NO, ti crei uno script che naviga le pagine come se fosse un motore di ricerca (quindi vede la pagine in modo "html"), e "scnanerizzi"/"scandisci" il codice html. [/supersaibal]
PS: un grab di 2000 pagine è fastidioso per un server come aruba?
usate prodotti come Xenu..
e usare la google sitemap?
Vendi viaggi? Ricevi visite targetizzate gratis, contatti via PM