Visualizzazione dei risultati da 1 a 6 su 6
  1. #1

    Ancora sui motori di ricerca interni...

    Volendo applicare un motore di ricerca fatto in php ad un sito fatto da terze parti in html ditemi se è giusto il ragionamento fatto.

    - Inserisco la stringa di ricerca...
    - Apro ogni file htm del sito e faccio la ricerca della stringa nel contenuto...
    - nel caso la stringa sia presente salvo il nome del file...
    - prendo la porzione di stringa cercata dal file più 50 caratteri in testa e in coda della stringa...
    - riporto il link della pagina e la porzione di stringa...

    E' giusta come idea?
    Se tu dai una moneta e me e io una a te avremo una moneta ciascuno, ma se io do uno script a te e tu uno a me, avremo due script ciascuno.
    Maledetto script di configurazione! - And therefore the scythe cuts down its victims…

  2. #2
    si ma devi lavorare leggendo i file

    per me ti conviene inserire i dati nel db ed estrapolarli da li

  3. #3
    Lo so benissimo che devo lavorare sui file. Purtroppo il sito viene generato ogni 2 ore da un'applicativo in una sede non di nostra competenza, che genera le pagine HTML e le carica via FTP su di un server remoto. Non ho fisicamente la possibilità di inserire i file in un db; posso solo andare a creare un'interfaccia principale che includa questi html e ne faccia la ricerca.

    A questo punto sono giusti i passaggi elencati?
    Se tu dai una moneta e me e io una a te avremo una moneta ciascuno, ma se io do uno script a te e tu uno a me, avremo due script ciascuno.
    Maledetto script di configurazione! - And therefore the scythe cuts down its victims…

  4. #4
    Attenzione... ho avuto l'idea delle idee! Faccio un crawler che mi apre le pagine... legge tutte le parole... le memorizza in un db falciando le parole comuni... lo faccio girare anche io ogni 2 ore e dovrei esssere a posto... l'unico problema è che deve essere più veloce del generatore di pagine... posso solo provare...
    Se tu dai una moneta e me e io una a te avremo una moneta ciascuno, ma se io do uno script a te e tu uno a me, avremo due script ciascuno.
    Maledetto script di configurazione! - And therefore the scythe cuts down its victims…

  5. #5
    La cosa migliore è (come hai scritto sopra) scrivere una funzione ricorsiva che entri nelle varie cartelle del file sys e si smazzi i files alla ricerca di riscontri delle chiavi. poi volendo puoi sbizzarirti quanto vuoi ad impreziosire il motore (rilevanza, and e or sui termini etc)


  6. #6
    Quindi intendi che devo lavorare sempre all'interno dei file?
    Senza crawler che analizza la pagina e memorizza nel database?
    Se tu dai una moneta e me e io una a te avremo una moneta ciascuno, ma se io do uno script a te e tu uno a me, avremo due script ciascuno.
    Maledetto script di configurazione! - And therefore the scythe cuts down its victims…

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.