Visualizzazione dei risultati da 1 a 10 su 10
  1. #1
    Utente di HTML.it L'avatar di stranyera
    Registrato dal
    Feb 2001
    Messaggi
    1,101

    niubba: da un testo ricavare le parole chiave

    Ciao a tutti,
    scusatemi ma è la prima volta qua dentro per me
    Allora, volevo sapere questo: ho una pagina che contiene del testo/dei testi.
    Esiste un qualcosa che permette, tramite l'inserimento di un determinato testo che è comunque parte della pagina, ricavare delle parole chiave?

    Grazie mille

  2. #2
    Moderatore di Motori di ricerca e webmarketing L'avatar di rigby76
    Registrato dal
    Oct 2005
    residenza
    Firenze
    Messaggi
    4,913
    Se è per redigere il metakeyword ti consiglio di lasciar perdere che non ne vale la pena: i motori sanno già come estrarre le keyword dai testi e non hanno bisogno che sia il webmaster a farlo per loro (dato che perlopiù lo facevano truffaldinamente).

    In generale è possibile, avrai bisogno di appoggiarti ad un linguaggio di programmazione lato lato server (php, asp, java) che possa accedere ai testi... dopodiché dipende da quanto hai bisogno che sia sofisticato l'algoritmo. Se ti accontenti di estrarre le parole che appaiono con maggior frequenza non sarà difficile; se invece vuoi individuare i termini più significativi del testo dovrai studiarti un po' di tecniche di information retrieval...

    estremizzo, banalizzo e polemizzo!

    Hai letto le FAQ sui Motori di Ricerca?

  3. #3

    .....

    i motori leggono già il testo ed estrapolano le key... forse dovresti far ein modo di avee un abuona key density ma non serve quasi a nulla.

  4. #4
    esatto ha ragione rigby....

    posso darti indicazioni in merito indicandoti 3 degli algoritmi migliori che sono l'algoritmo implementato da Kea ( http://www.nzdl.org/Kea/ ), il Phraserate ( http://ivia.ucr.edu/projects/publica...PhraseRate.pdf ) e l'algoritmo Textrank ( http://www.cs.unt.edu/~rada/papers/mihalcea.emnlp04.pdf ), quest'ultimo è usato da Google per estrapolare le keyphrase dai documenti indicizzati da Google Book Search

    il primo algoritmo va addestrato e usa un classificatore bayesiano che valuta due soli parametri e cioè la tfxidf e la prossimità.....

    il secondo sfrutta invece la struttura del markup per dedurre quali sono le parti di testo importanti, funziona ma solo su pagine fatte come il W3C comanda, ma in giro ce ne sono pochissime

    il terzo algoritmo è a mio avviso il migliore, sfrutta una variante dell'algoritmo Pagerank solo che è applicato alle parole contenute nel testo....

    il terzo algoritmo fuso con Phraserank produce risultati molto interessanti, in pratica Textrank assegna inizialmente a tutte le parole lo stesso peso e cioè 1, invece basta modificarlo e assegnare i pesi iniziali in base alle caratteristiche dell'html, per esempio una parola nel <title> vale di più di una parola nel <body>, una parola in [b] vale di più di una parola in

    e così via....

  5. #5
    Moderatore di Motori di ricerca e webmarketing L'avatar di rigby76
    Registrato dal
    Oct 2005
    residenza
    Firenze
    Messaggi
    4,913

    Re: .....

    Originariamente inviato da cosencao
    forse dovresti far ein modo di avee un abuona key density ma non serve quasi a nulla.
    che aiuto pensi tu possa dare a una persona con una farse del genere?
    estremizzo, banalizzo e polemizzo!

    Hai letto le FAQ sui Motori di Ricerca?

  6. #6
    Utente bannato
    Registrato dal
    Jun 2003
    Messaggi
    1,011
    paolino percaso hai idea che cosa usa yahoo per estrapolare le key da un testo ? C'è un plugin di wordpress (Ultimate Tag warrior) che si appoggia a yahoo per estrapolare i TAG dell'articolo che andrai a pubblicare, però non ho idea in base a che cosa sceglie delle parole invece che altre

  7. #7
    Originariamente inviato da The knight
    paolino percaso hai idea che cosa usa yahoo per estrapolare le key da un testo ? C'è un plugin di wordpress (Ultimate Tag warrior) che si appoggia a yahoo per estrapolare i TAG dell'articolo che andrai a pubblicare, però non ho idea in base a che cosa sceglie delle parole invece che altre
    non so di preciso ma deve trattarsi comunque di un algoritmo che fa uso di grafi....ho testato varie possibilità e gli algoritmi stile-Pagerank danno i migliori risultati...non mi meraviglierei se usassero proprio il Textrank

  8. #8
    confermo quanto detto, ho appena testato il servizio di Yahoo ( devo ammettere che non lo conoscevo ) e i risultati sono molto simili al mio tool, con la differenza che il mio tool dà peso alla struttura del markup e produce un numero più elevato di keyphrase

  9. #9
    Utente bannato
    Registrato dal
    Jun 2003
    Messaggi
    1,011
    Ok, guardando il codice sono arrivato a questa pagina http://developer.yahoo.com/search/co...xtraction.html

    ma a che algoritmo si appoggia ?

  10. #10
    Originariamente inviato da The knight
    Ok, guardando il codice sono arrivato a questa pagina http://developer.yahoo.com/search/co...xtraction.html

    ma a che algoritmo si appoggia ?
    esatto, effettua un POST a quell'URL, inviandogli nel form appid che è il nome registrato presso Yahoo ( simile alle API key di Google ) e context che contiene il testo da cui estrarre le keyphrase, le altre variabili sono opzionali

    riguardo l'algoritmo è ovviamente occultato dietro le quinte, ma visto il lavoro fa e la similarità con i risultati del Textrank ritengo che sia un algoritmo simile e cioè un algoritmo che tiene conto delle connessioni locali tra varie categorie di elementi lessicali, più precisamente aggettivi e sostantivi

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2026 vBulletin Solutions, Inc. All rights reserved.