Scusatemi se magari chiedo cose che ci sono già scpiegate, ma ho poco tempo perchè mi serve aiuto per un esame all'uni.
Praticamente devo costruire un programma Perl che mi permetta di cambiare dei caratteri ad un corpus di testi, tipo:
# sostituzione "riferimenti ad entità" caratteri di SGM/XML con caratteri ISO-Latin-1 e altri caratteri non-standard
while (<>) {
s/À/À/g;
s/È/È/g;
s/à/à/g;
s/ç/ç/g;
s/‐/-/g;
s/&dquo;/"/g;
s/é/é/g;
s/è/è/g;
s/…/…/g;
s/‐/-/g;
s/ì/ì/g;
s/ò/ò/g;
s/&p1;/./g;
s/&p2;/./g;
s/%/%/g;
s/ù/ù/g;
s////g;
s/&to;/-/g;
s/&va;/,/g;
s/&ba;/\//g;
}
Ecco il mio problema è che non so come applicare questo programma al corpus, qualcuno mi può aiutare?
Grazie!