IL FALÒ DELLA POPOLARITÀ. I tempi di Bartolo Pieggi sono tramontati e Google comincia ad assomigliare al «cervello del mondo», un passaggio quasi obbligato per la gran massa dei navigatori a caccia di informazioni. Ma come ragiona questo cervello? Date le parole chiave che noi scriviamo nell’apposita finestrella, con quale criterio Lui ci restituisce certe pagine web, e con quale criterio le ordina? Perché una certa pagina ci appare nella prima schermata e un’altra nella schermata 326, che non leggeremo mai?
Innanzitutto bisogna sapere che la nostra ricerca non scandaglia la rete Internet, ma l’archivio contenuto nei computer di Google, dove sono raccolte e indicizzate circa 2 miliardi di pagine, secondo l’azienda. Comunque meno di un decimo di tutte quelle presenti sul Web. Tutte le altre, con Google non le troveremo mai. Quali pagine finiscono negli archivi? Quelle scovate automaticamente da programmi (crawler) che partono da pagine base (per esempio Yahoo!, Bbc, Cnn…) e «strisciano» nella rete seguendo a cascata tutti i link che trovano.
Lo spirito di Google sta nel suo algoritmo, cioè nella formula matematica grazie alla quale il motore stabilisce che una certa pagina (una singola pagina, non l’intero sito) ha un punteggio più alto e perciò merita di esserci segnalata prima di un’altra. Il punteggio si chiama PageRank ed è sostanzialmente un misuratore matematico della popolarità. Date le parole chiave immesse dal navigatore, la mia pagina web è importante se è segnalata da moltre altre pagine. È più importante se le pagine che mi segnalano hanno un punteggio alto (cioè se a loro volta sono popolari). È più importante se il link che mi arriva dalla pagina di qualcun altro non annega in mezzo a decine o centinaia di link verso altre pagine.

IL FATTORE NOIA. Come si fa a tradurre in numeri la popolarità? Il colpo di genio di Page e Brin sta proprio in questo. L’algoritmo di Google è cambiato e si è affinato nel tempo, sono stati aggiunti nuovi criteri di valutazione delle pagine, e parte di queste novità rimangono segrete. Ma lo spirito resta quello illustrato dai suoi inventori nella relazione presentatata nel 1998 (www-db.stanford.edu/~backrub/google.html). Questo algoritmo vale miliardi di dollari (poi dicono che la matematica nella vita non serve) e impone una gerarchia al mondo. Perciò vale la pena di vedere come è fatto e che cosa vuol dire.
Su una qualunque pagina che chiamiamo «A», il PageRank (PR, cioè il punteggio) è calcolato così:

PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

«d» è un numero fisso, stabilito a capocchia tra 0 e 1, di cui parleremo dopo. PR(T1) è il punteggio della prima pagina che ha un link verso A. Viene diviso per C(T1), cioè per il numero totale di link che escono dalla pagina T1. In pratica, la popolarità della mia pagina A aumenta se T1, che mi linka, è a sua volta popolare. Ma diminuisce se T1 elenca tantissimi altri link tra i quali il mio rischia di «affogare». La stessa procedura si ripete per tutte le pagine che hanno un link verso A, fino all’ennesima (Tn), sommando tutti i risultati.
Il numerino «d» non cambia le carte in tavola, ma siccome c’è va spiegato. Ed è qualcosa che ha a che fare con la noia di navigare. L’algoritmo di Google, infatti, rappresenta il comportamento di un frenetico navigatore che salta da una pagina all’altra cliccando del tutto a caso tra i link: rappresenta cioè la probabilità che quel navigatore capiti su una certa pagina. Se andasse avanti in modo indefinito, non avremmo bisogno di «d». Invece il navigatore si stufa, quindi Page e Brin introducono questo numerino, un fattore di riduzione che abbassa tutti i PageRank. Lo fissano arbitrariamente a 0,85. «d» garantisce inoltre che tutte la pagine, anche quelle non segnalate da nessuno, abbiano un piccolissimo PageRank e quindi saltino fuori nella ricerca, magari alla famosa schermata 326. Infatti il PageRank di un sito ignorato da tutti è: (1-0.85)+0.85X0=1-0,85=0,15.
IL TERZO UOMO: ITALIANO. «Il fatto che uno sia popolare non significa che sia un galantuomo». L’obiezione è accompagnata da un sogghigno che rimanda alla politica italiana. Chi la fa ha voce in capitolo perché è l’unico italiano citato da Page e Brin tra i contributi scientifici che hanno aperto la strada a Google. Si chiama Massimo Marchiori, ha 34 anni, insegna materie informatiche all’Università di Venezia e fa il ricercatore al Mit di Boston, dove collabora con Tim Berners-Lee, l’inventore del Web. Ha conosciuto Larry Page nell’aprile del 1997, alla Sesta conferenza internazionale sul World Wide Web di Santa Clara (California), e lo ricorda come un tipo «umile, molto alla mano, con una mentalità più imprenditoriale rispetto a Sergey Brin». I motori di ricerca dell’epoca, ricorda Marchiori, «davano un punteggio a ogni singola pagina e basta. Io ne presentai un nuovo, Hypersearch, che andava a vedere anche la relazione della pagina con il resto del Web». L’idea vincente di Google è quindi un misconosciuto made in Italy. «Solo che io la pensavo in un altro modo rispetto a Page e Brin. Nella loro impostazione, se un sito di auto è segnalato da un sito di auto o di scooter il punteggio non cambia. Ma il navigatore sta cercando auto, non scooter. Il mio progetto teneva conto di questo, privilegiava la qualità dell’informazione che posso raggiungere da un sito, non la sua popolarità».
Se oggi Google non è italiano è perché i due studenti di Stanford hanno ben miscelato il genio matematico con quello imprenditoriale: «Con l’algoritmo giusto, la loro strada consentiva ricerche più veloci», riprende Marchiori. «In più, in un’epoca in cui Yahoo! e gli altri costruivano grandi portali pieni di roba, loro hanno avuto l’intuizione di fare un sito semplice, con il motore e nient’altro. Ricordiamoci che a quell’epoca le connessioni erano lente e le pagine web si aprivano a fatica. Google invece si apriva subito e rispondeva rapidamente alle ricerche. Molti navigatori cominciarono a preferirlo anche se il suo archivio, agli inzi, era molto più piccolo di quello dei concorrenti».
Anche grazie a queste intuizioni Google è diventato il «cervello del mondo», una fonte di informazione quasi monopolistica per milioni di navigatori. Entrare nei suoi meccanismi, quindi, è qualcosa che ha a che fare con la democrazia. «Google presenta lo stesso problema della tv: se hai qualcosa di interessante da dire ma non hai il “canale”, la tua informazione vale zero», spiega Marchiori. «Google decide lo “share” di un programma, cioè di un sito. In fondo si basa sulla raccomandazione. Più un sito è raccomandato da altri, più è visibile, e questo agli albori del Web andava anche bene. Ma oggi è diventata fondamentale la pubblicità, cioè la raccomandazione a pagamento. La prospettiva cambia completamente». E qui si innesta una spirale viziosa: i «voti» a pagamento spingono in alto certe pagine, che così diventano popolari e ottengono anche i voti «democratici» dei siti disinteressati, e l’effetto spinta si moltiplica. «Infatti gli ultimi studi sui motori di ricerca dicono che Google sta peggiorando», conclude Massimo Marchiori.