Secondo voi che % massima di similarità devono avere 2 pagg per non incappare nel filtro anti-duplicazione?

Scandagliando il web ho notato che i siti costruiti e ben posizionati dalla stessa mano hanno 40% HTML simile e 30% similarità di testo (strumento by motoricerca)

Prospetto 4 casi:

1) Pagg stesso sito
2) Pagg siti divesi stesso IP(al massimo cambia l'ultimo ottetto)
3) Pagg dorway stesso sito
4) Pagg dorway siti divesi stesso IP(al massimo cambia l'ultimo ottetto)

E ora a voi miei cari