Low faceva notare che la Key Density è ormai un concetto poco influente, considerando che ci sono altri mille fattori più importanti e che comunque è solo uno di questi mille fattori.

Tuttavia esisterà sempre un parametro ideale, anche se il suo calcolo dovesse essere differente da sito a sito e variabile nel tempo e secondo gli algoritmi, la Key Density rimarrà comunque un elemento dell'algoritmo di posizionamento.


Ebbene stavo pensado che ogni parola in italiano ha una frequenza di utilizzo diversa dalle altre, e tale frequenza cambia ancora a seconda dei settori. Ebbene molto probabilmente la key density ideale (per quanto poco possa contare rispetto agli altri parametri) dipende sicuramente dalla parola stessa!

es.
se cerco cane su google.it = 1.980.000
guinzaglio = 214.000
guinzaglio cane = 101.000

P(cane) = 1.980.000 / numero_totale_pagine_indicizzate
P(guinzaglio) = 214.000 / numero_totale_pagine_indicizzate
P(guinzaglio & cane) = 101.000 / numero_totale_pagine_indicizzate
P(guinzaglio|cane) = P(guinzaglio & cane)/P(cane) = 5%
P(cane|guinzaglio) = P(guinzaglio & cane)/P(guinzaglio) = 47%

tradotto: se una pagina parla di cani e non di guizagli ok. Viceversa, se parla di guinzagli, ma non di cani, la cosa inizia ad essere considerata strana...

I dati non sono molto indicativi, perchè non si dovrebbe contare il numero di siti sui cani, ma il numero di volte in cui la parola cane è ripetuta in ciascuno di quei siti...
Comunque cane è usato in italiano 10 volte più di guinzaglio

Secondo voi cosa penserebbe google se il vostro sito ripete la parola guinzaglio 10 volte più della parola cane?


Ripeto che non basta vedere le pagine di google su un certo argomento, ma bisognerebbe avere il numero di volte che una parola è ripetuta in quelle pagine. Le due statistiche coinciderebbero se il numero di siti che parlano di cani fosse uguale al numero di siti che parlano di guinzagli...



PS: il giochetto di sopra con le probabilità condizionate può essere automatizzato con una tecnica basata sull'Information Gain o sulle reti neurali e allora altro che giochetto. Negli usa il ministero dell'agricoltura usa queste tecniche per scoprire i truffatori e funzionano alla perfezione.