Secondo me ti conviene piu' che scannerizzare le immagini scrivere il testo direttamente in html specificando la fonte e la data.
Le immagini infatti rischierebbero di essere poco leggibili.
Una volta un sito trattava in questo modo la sezione press newsboard e non sono riuscita a leggere neanche un articolo perchè lo scarcamento era lento e le imamgini di scarsa qualità!

Ciao