Leggere si può leggere qualunque cosa... il problema è interpretarlo. I PDF sono un formato binario non semplicissimo da parsare, e soprattutto danno una descrizione "grafica" della pagina (non è raro di avere ogni singolo carattere in un "box" separato), per cui non è per niente banale da gestire se ti aspetti un input testuale (se poi il testo è renderizzato come curve sostanzialmente non c'è alcuna speranza di recuperarlo).
Piuttosto, potrebbe aver senso far leggere al tuo programma l'input da stdin, e nel caso sia necessario prendere input da un pdf metterlo in pipe con un'utility come pdftotext.

Rispondi quotando