Originariamente inviato da ppevans
Senti Paolino, ci puoi fare un esempio di errore nel codice (anche semantici) che mister google non riesce a digerire?
(Quando si blocca e rinuncia)
Grazie.
PS. Anche yahoo, mi sembra, da molta importanza al codice.
un esempio banale può essere questo
codice:
<html><head><title>blah blah blah</title></head>
<body>
<table summary="example">
<tbody>
<tr>
<td>xxx</td>
</tr>
</tbody>
</table>
</body>
</html>
si nota che il tag di chiusura del commento è sbagliato....ebbene in quel caso il parser va in crash....
è un esempio tra i più estremi anche se gli esempi più gravi sono quelli legati a quando si prendono lucciole per lanterne....è capitato nel mio caso usando Tidy di ritrovarmi pezzi di codice javascript nel testo....questo perchè c'erano problemi con i tag di chiusura e apertura
infine ci possono essere errori dovuti all'interpretazione....
per esempio
codice:
<html><head><title>Page title</title></head>
<body>
blah blah blah.
boom boom boom.
</html>
diventa
<html><head><title>Page title</title></head>
<body>
blah blah blah.</p>
boom boom boom</p>
</html>
si nota come il sistema chiuda i tag automaticamente, tuttavia potrebbe essere che la forma "corretta" non corrisponda a quello che il creatore della pagina voleva fare....in questo caso ci possono essere in alcuni casi dei problemi nell'interpretare la semantica del codice, per esempio il Phraserank usa i tag html per capire quali frasi sono più importanti, quali sono collegate a quali altre....se il sistema comincia ad interpretare a modo suo è possibile che capisca tutt'altro rispetto a quello che il webmaster intendeva comunicargli
comunque in linea di massima se i browser riescono a visualizzare correttamente i documenti, allora pure i parser dei motori riescono a tirarne fuori qualcosa di sensato....tuttavia i browser hanno un'euristica molto più robusta e quindi se la cavano molto meglio