Pagina 1 di 3 1 2 3 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 29
  1. #1
    Utente di HTML.it
    Registrato dal
    Feb 2004
    Messaggi
    910

    Secondo me è impossibile..però ci riescono!?!

    Salve!
    Non sono mai riuscito a spiegarmi una cosa...
    I database più famosi sono mysql, oracle, Sql Server della microsoft...bene...ora...leggendo vari test che sono stati fatti su questi database, mi è sorto un dubbio...come fa google a salvare tutti quei dati nel database??Perchè i migliori database possono reggere milioni di record, ma non 8.058.044.651 pagine web...come è possibile?!?!
    Boh...illuminatemi

  2. #2

  3. #3
    Veramente oracle arriva tranquillamente a gestire i miliardi di record. Considera che non è fondamentale che sia un solo database fisico.

  4. #4
    Originariamente inviato da fradefra
    Veramente oracle arriva tranquillamente a gestire i miliardi di record. Considera che non è fondamentale che sia un solo database fisico.
    Esatto, spesso sono cluster di server anche per poter gestire in modo ottimale prestazioni di connessione, quantitativi di dati e backup dei dati stessi.

  5. #5
    Utente di HTML.it
    Registrato dal
    Feb 2004
    Messaggi
    910
    Originariamente inviato da weppos
    Esatto, spesso sono cluster di server anche per poter gestire in modo ottimale prestazioni di connessione, quantitativi di dati e backup dei dati stessi.
    mmm....ma, per esempio, come fa google, data una parola, a sapere dove ricercarla?? Server1 - Server2 - Server3 etc etc????
    grazie

    Db che reggono miliardi di record??Mah, voglio ricordarti che google si salva tutto il testo di una pagina, quindi è un po pesantuccio...no?
    GRazie per la risp

  6. #6

    esistono N datacenter

    ogni datacenter ha N database gestiti da pc in clustering con DB che si possono personalizzare e SO come Linux.

    Non è finita....c'è la possibilità di crearsi un Database e quindi un sistema dati con linguaggi di programmazione.

    quando si fa una query G instrada la domanda ad un server di risposta il quale ha al suo interno un DB con record statici, aggiornati ogni gg in real time ad una determinata ora.
    il clustering di pc con linux e DB dinamico associato ad una linea digitale personalizzata permette la velocità del tutto.

  7. #7
    Db che reggono miliardi di record??Mah, voglio ricordarti che google si salva tutto il testo di una pagina, quindi è un po pesantuccio...no?
    Non proprio.
    I processi di indicizzazione sono diversi.

    In primo luogo le pagine vengono salvate temporaneamente.
    Tali record vengono poi esaminati, elaborati ed infine un indice di ricerca più o meno definitivo viene immagazzinato nel database di ricerca.

    Questo indice è notevolmente più leggero poichè specifico per le ricerche.

    Tempo fa saibal fece involontariamente un esempio molto calzante in risposta ad un forumista su Off Topic.
    In questo forum (e diversi altri) il database dei topic è separato da quello di ricerca e l'esempio riportato segnalava come il db dei topic pesasse 2 Gb mentre quello di ricerca poco più di 700 Mb.

    Questo perchè man mano che vengono scritti topic gli stessi vengono parsati e viene creato (in questo caso on the fly) un indice di ricerca.

  8. #8
    Le tecniche di Information Retrieval oggi consentono di fare molto.
    Le pagine non è detto che debbano essere salvate nel database. Se stanno nel database, probabilmente sono una serie di database diversi.

    E' immaginabile una struttura del tipo:
    - un database (o più di uno) contiene titoli e puntatori
    - un database (o più di uno) contiene indici ed aggregati
    - molti database contengono le pagine fisiche

    Le pagine, per esempio, è possibile che siano file system.

  9. #9
    Utente di HTML.it
    Registrato dal
    Feb 2004
    Messaggi
    910
    ok, ho la situazione pià chiara...

  10. #10
    voglio ricordarti che google si salva tutto il testo di una pagina, quindi è un po pesantuccio...no?
    Pensa alle immagini allora....ok non le indicizza tutte, ma pesano comunque molto piu del testo...

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.