Quote Originariamente inviata da BigBlack Visualizza il messaggio
Cmq ho provato a scaricare po4a ma non riesco ad aprirlo. Sembra più un file per mac. Io sono sotto windows.
È un modulo Perl, credo possa girare tranquillamente su Windows una volta installato Perl ed eventuali dipendenze.
Ditemi voi quale pensate sia la chiave migliore per risolvere questo problema.
Dovendo scegliere tra i vari VB, sceglierei VB.NET (una qualunque versione recente); in tal caso, userei una libreria per il parsing di HTML tag soup (credo che HTML Agility Pack possa andare bene) per effettuare il parsing del tuo documento, estrarre i nodi di testo e generare in output le stringhe assieme ad un qualche ID (viceversa, una volta ottenuto il file tradotto andresti a sostituirlo nell'albero DOM per poi ri-generare l'HTML in output).
Cmq io ovviamente so quali sono le parole da non tradurre. E allo stesso modo istruirei il traduttore eliminando le singole parole dei menu dal database così creato. Mi preoccupa solo una cosa la possibilità che vengano sostituite singole parole che si trovano all'interno di frasi più grandi e che quindi al passo successivo quella frase più grande non venga più riconosciuta in quanto con una parola cambiata.
È esattamente il motivo per cui dovendo internazionalizzare un progetto si parte subito con il piede giusto usando strumenti e convenzioni per ridurre questo genere di problemi.