Originariamente inviato da ppevans
Senti Paolino, ci puoi fare un esempio di errore nel codice (anche semantici) che mister google non riesce a digerire?
(Quando si blocca e rinuncia)
Grazie.

PS. Anche yahoo, mi sembra, da molta importanza al codice.
un esempio banale può essere questo

codice:
<html><head><title>blah blah blah</title></head>

<body>
<table summary="example">
  <tbody>
  
  <tr>
    <td>xxx</td>
  </tr>
  </tbody>
</table>
</body>
</html>
si nota che il tag di chiusura del commento è sbagliato....ebbene in quel caso il parser va in crash....

è un esempio tra i più estremi anche se gli esempi più gravi sono quelli legati a quando si prendono lucciole per lanterne....è capitato nel mio caso usando Tidy di ritrovarmi pezzi di codice javascript nel testo....questo perchè c'erano problemi con i tag di chiusura e apertura

infine ci possono essere errori dovuti all'interpretazione....

per esempio

codice:
<html><head><title>Page title</title></head>

<body>


blah blah blah.


boom boom boom.
</html>

diventa

<html><head><title>Page title</title></head>

<body>


blah blah blah.</p>


boom boom boom</p>
</html>
si nota come il sistema chiuda i tag automaticamente, tuttavia potrebbe essere che la forma "corretta" non corrisponda a quello che il creatore della pagina voleva fare....in questo caso ci possono essere in alcuni casi dei problemi nell'interpretare la semantica del codice, per esempio il Phraserank usa i tag html per capire quali frasi sono più importanti, quali sono collegate a quali altre....se il sistema comincia ad interpretare a modo suo è possibile che capisca tutt'altro rispetto a quello che il webmaster intendeva comunicargli

comunque in linea di massima se i browser riescono a visualizzare correttamente i documenti, allora pure i parser dei motori riescono a tirarne fuori qualcosa di sensato....tuttavia i browser hanno un'euristica molto più robusta e quindi se la cavano molto meglio