Sai come "stirarli" nei rispettivi layer?
Se sì, fallo. Se no, seguimi:

Posizionati una cinquantina di frames a dx rispetto al frame che contiene il suono, clicca col destro e scegli "Insert frames".
Fallo più volte finché non si presentano frames vuoti. Dopodiché, elimina i frames vuoti.

In quel modo il sincronismo tra suono e immagini diventa pressoché perfetto, ad ogni ciclo.

Se il suono è già caricato completamente (come nel tuo caso), non influisce sulla fluidità del filmato.

Cmq, gioca un po' anche con il frame rate.

Ciao,

NAP