Di che parla la pagina?
codice:
word repeats density Prominence  word repeats density Prominence  
titolo  7   T,D,H,B,A  2.55% 83.32 una  7   D,A  2.55% 45.46 
film  7   T,D,K  2.55% 62.88 trama  6   T,D,K,H,B  2.19% 70.50 
recensione  4   T,K,H,B  1.46% 73.45 absolom  4   D,K  1.46% 61.50 
sono  3     1.09% 42.09 che  3     1.09% 37.71 
voto  3   H,B  1.09% 53.16 non  3     1.09% 29.20 
uno  2     0.73% 39.78 quello  2     0.73% 36.68 
interessante  2     0.73% 19.34 virus  2   D,K  0.73% 80.66 
ogni  2     0.73% 38.87 videogiochi  2   K,L  0.73% 58.58 
sito  2   D  0.73% 89.42 con  2     0.73% 35.40 
regia  2   B  0.73% 39.78 cerca  2   L  0.73% 42.52 
atmosfere  2     0.73% 22.26 anche  2     0.73% 24.27 
alla  2     0.73% 38.32 perlman  2     0.73% 66.79 
vedere  2     0.73% 10.95 8226;  2     0.73% 82.12 
ron  2     0.73% 67.15 romanzi  2   D,K,L  0.73% 87.41
Se non riuscite a dirlo voi, immaginate una macchina...

Ma proviamo a fare un secondo esperimento. Raccogliamo le key a due a due e vediamo se capite di cosa parla il sito...


codice:
phrase repeats density Prominence  
7 0 3 H,B 2.19 % 52.80  
trama e 3 D,H,B 2.19 % 82.85  
voto 7 3 H,B 2.19 % 53.16  
& 8226; 2  1.46 % 82.48  
da vedere 2  1.46 % 11.31  
e recensione 2 H,B 1.46 % 78.47  
e una 2 D 1.46 % 50.55  
interessante e 2  1.46 % 19.34  
ron perlman 2  1.46 % 67.15  
titolo voto 2 H 1.46 % 77.55  
un film 2  1.46 % 29.20

Di che parla? Ancora una volta fatichiamo a capirlo. Proviamo con frasi di tre parole

codice:
phrase repeats density Prominence  
voto 7 0 3 H,B 3.28 % 53.16  
titolo voto 7 2 H 2.19 % 77.55  
trama e recensione 2 H,B 2.19 % 78.83

Ci siamo, si inizia a capire...




Ma allora la domanda è... quale peso google da ai vari raccoglimenti possibili in una pagina?

Userà mille altri algoritmi, ma sicuramente ha almeno un algoritmo che si occupa di questa scelta.

Voi che ne pensate?