puoi a costo di sacrificare tantissimo in qualità, ad esempio variando la frequenza di campionamento da 44100 a 22050, da 16bit a 8 bit, da stereo a mono, ecc

per questo poi usare Cdex