il casino è che il testo nei pdf è generalmente compresso, ovvero un reader usa in genere un filtro per decodificarne il valore.
Infatti un pdf può essere anche scritto tutto in ASCII, ma in genere non viene fatto, perché troppo pesante...
Dovresti avere un motore capace di decodificare la parte binaria compressa... Ma non so né se c'è né dov'è...