Mi servirebbe qualche formula matematica/libreria di machine learning che mi effettui dei raggruppamenti per similiarità.

Gruppo 1)
[0, 0, 0, 0, 27, 0, 0, 0, 0, 7, 0, 8, 1, 5, 5, 0, 10, 0, 11, 4, 12]

Gruppo 2)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 1, 0, 11, 5, 6, 12]

Gruppo 3)
[2, 3, 4, 4, 3, 4, 3, 4, 2, 4, 2, 4, 4, 2, 10, 2, 0, 11, 4, 6, 12])


In questo caso se notate, il gruppo 2 e 3 sono "quasi" identici (differiscono solo per alcuni elementi), vorrei raggruppare il 2 con il 3 e lasciare il primo da solo.

Informazioni
- Questi 3 gruppi sono solo d'esempio visto che ho a che fare con migliaia di gruppi
- Come per il k-mean vorrei poter essere io a decidere il numero di clusters