Il mio boss mi ha chiesto di fargli delle elaborazioni su un db contenente 4-5 campi in formato csv.. niente di particolare.. dal CF estrarre la data di nascita e fare qualche report su età media, importi per area geografica.. un po' più palloso per gli output di percentili dove bisogna riordinare e calcolare i cumulati (es. 50% degli importi va in 5 regioni..).. però.. insomma.. tutte cose che si possono fare tranquillamente con un foglio di calcolo o con uno scriptino in python...

Il problema...

..è che i record sono TRE MILIONI ! Il csv è di 280MB... con cosa lo posso elaborare??? Ho in mente un paio di ipotesi ma vorrei un parere da parte vostra...

1) Elaborazione dei singoli records con python (legge linea per linea e calcola i campi necessari tipo età, sesso, personalità fisica|giuridica..) + gestione reportistica in mysql
2) realizzazione di un programmino ad hoc in C++

Cosa ne pensate ??