È sostanzialmente una convenzione che dipende da diversi "accidenti storici", spinta anche dal fatto che 8 bit per byte è un numero in genere abbastanza "comodo" (256 caratteri sono un charset abbastanza esteso, un byte di 8 bit si può visualizzare in maniera comoda come due "nibble" esadecimali, per far riferimento ad un bit in un byte basta un intero da 3 bit, ...)
http://en.wikipedia.org/wiki/Byte#History
http://programmers.stackexchange.com...are-eight-bits