Visualizzazione dei risultati da 1 a 3 su 3
  1. #1

    Sostituire carattere durante download file

    Ciao ragazzi!!
    Grazie a voi so che il metodo più efficiente per scaricare pagine web è il seguente che bufferizza il tutto al fine di ottimizzare le risorse per qualsiasi tipo di file:
    codice:
    protected static void downloadFromUrl(URL url, String localFilename, String userAgent) throws IOException {
    		
    		InputStream is = null;
    		FileOutputStream fos = null;
    		try {
    			
    			int deleteTheProxyFromTheOpenConnection;
    			Proxy proxy = new Proxy(Proxy.Type.HTTP, new InetSocketAddress("wwwcache.open.ac.uk", 80));
    			URLConnection urlConn = url.openConnection();
    			urlConn.setRequestProperty("User-Agent", userAgent);
    			is = urlConn.getInputStream();
    
    			fos = new FileOutputStream(localFilename);
    			byte[] buffer = new byte[1024];
    			int len;
    			while((len = is.read(buffer)) > 0)
    				fos.write(buffer, 0, len);
    		}
    		finally {
    			
    			try {
    				if(is != null)
    					is.close();
    			}
    			finally {
    				if(fos != null)
    					fos.close();
    			}
    		}
    	}
    Il mio problema è che vorrei cancellare tutti i segni '%' all'interno della mia pagina web perché ho degli indirizzi del tipo:
    http://www.%D7%A0%D7%95%D7%A4%D7%A9-...%A0%D7%95.html
    che mi fanno crashare tutto il sistema perché non sono 'ben formati'!!
    Tutti questi segni percentuali dovrebbero essere una particolare codifica di caratteri arabi o comunque non occidentali!

    Per non perdere in prestazioni, esiste un modo per evitare di rileggere l'intero file e cancellare manualmente tutti i '%'?

    Grazie mille, ciao!!

  2. #2
    Utente di HTML.it
    Registrato dal
    Mar 2010
    Messaggi
    68
    Non ho ben capito se l'URL mal formattato che ti da problemi è quello che stai passando alla funzione downloadFromUrl e come lo ottieni.

    P.S. Per gestire la formattazione di un URL guardati le classi URLEncoder e URLDecoder

  3. #3
    Si, scusami!
    L'url di cui parlo è presente all'interno della pagina che scarico! In realtà si tratta di un file rdf che 'teoricamente' dovrebbe contenere solo URI ben formati...

    Un esempio di pagina in questione è questa: http://dbpedia.org/page/Milan

    Purtroppo non posso accedere all'url direttamente, e comunque l'URLEncoder non farebbe nulla sui segni percentuali...ho già provato!!

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.