Una soluzione potrebbe essere quella di leggere il file riga per riga e memorizzare le stringhe in un db.

Dopo puoi filtrare i risultati con l' SQL.

Ciao