Ciao ragazzi!!
Grazie a voi so che il metodo più efficiente per scaricare pagine web è il seguente che bufferizza il tutto al fine di ottimizzare le risorse per qualsiasi tipo di file:
codice:
protected static void downloadFromUrl(URL url, String localFilename, String userAgent) throws IOException {
InputStream is = null;
FileOutputStream fos = null;
try {
int deleteTheProxyFromTheOpenConnection;
Proxy proxy = new Proxy(Proxy.Type.HTTP, new InetSocketAddress("wwwcache.open.ac.uk", 80));
URLConnection urlConn = url.openConnection();
urlConn.setRequestProperty("User-Agent", userAgent);
is = urlConn.getInputStream();
fos = new FileOutputStream(localFilename);
byte[] buffer = new byte[1024];
int len;
while((len = is.read(buffer)) > 0)
fos.write(buffer, 0, len);
}
finally {
try {
if(is != null)
is.close();
}
finally {
if(fos != null)
fos.close();
}
}
}
Il mio problema è che vorrei cancellare tutti i segni '%' all'interno della mia pagina web perché ho degli indirizzi del tipo:
http://www.%D7%A0%D7%95%D7%A4%D7%A9-...%A0%D7%95.html
che mi fanno crashare tutto il sistema perché non sono 'ben formati'!! 
Tutti questi segni percentuali dovrebbero essere una particolare codifica di caratteri arabi o comunque non occidentali!
Per non perdere in prestazioni, esiste un modo per evitare di rileggere l'intero file e cancellare manualmente tutti i '%'?
Grazie mille, ciao!!