ciao,
vi scrivo poichè non riesco a venire a capo sul seguente tema, e volevo sapere se qualcuno di voi si è già cimentato a riguardo.
Volevo fare una funzione C++ che partendo da una foto dia in output il testo contenuto in essa, "leggendolo" ed identificando la posizione (X,Y sulla foto) in cui si trova.

Esempio: dalla foto della dispensa (o del frigorifero) vorrei ricavarmi in output tutte le scritte (sulle confezioni di cibo) ognuna con la sua posizione X,Y.

finora ho provato con la libreria tesseract (che però funziona bene solo con nero su bianco, e testi non obliqui/capovolti) e ho provato anche a precondizionare l'immagine passandola in bianco/nero ed aumentando il contrasto...ma nulla di che.

avreste idee per indirizzarmi? o meglio ancora esempi d qualcosa che fa ciò?
grazie in anticipo