[java] split file grosse dimensioni

**morphy79** · 22-06-2007, 18:32

ciao a tuti...
ho realizatto un programmino che apre un file di testo, lo splitta riga per riga, cerca in ogni riga se è presente una determinata stringa e se presente la riporta in una textarea...

funziona tutto... il problema si presenta su file di testo di grosse dimensioni.. tipo 50000 righe...
ci mette una vita !!!

avete consigli ???

riporto il codice del metodo che cerca la traccia...

codice:

	private void cercaTraccia(){
		
		// INIZIALIZZO RISULTATI RICERCA
		String risultatiRicerca = "";
		
		// SVUOTO LA TEXT AREA
		jTextArea_RisultatiRicerca.setText("");
		
		// RECUPERO LA TRACCIA
		String traccia = jTextField_RicercaTraccia.getText();
		
		// LETTURA DEL FILE
		String fileContent = "";
		FileHelper fileHelper = new FileHelper(); 
		try {
			fileContent = fileHelper.read(jTextField_PathFile.getText());
		} catch (IOException e) {
			e.printStackTrace();
		}
		
		// PREPARO I PARAMETRI PER LA RICERCA
		String [] parametriDaCercare;
		if(jCheckBox_Concatena.isSelected() == false){
			parametriDaCercare = new String[1];
			parametriDaCercare[0] = traccia;
		}else{ // SE HO PIù PAROLE DA CERCARE
			StringTokenizer st1 = new StringTokenizer(traccia, "+");
			parametriDaCercare = new String[st1.countTokens()];
			int i = 0;
			while (st1.hasMoreTokens()) {
				parametriDaCercare[i] = (st1.nextToken().trim());
				i++;	
			}
		}

		// RICERCA TRACCIA PER OGNI RIGA DEL LOG
		boolean rigaDaAggiungere = false;
		StringTokenizer st2 = new StringTokenizer(fileContent,"\n");
		String riga = "";
		while (st2.hasMoreTokens()) {
			
			// RECUPERO LA RIGA DI TESTO DEL LOG
			riga = st2.nextToken();
			
			// PER OGNI VOCE DELLA TRACCIA
			for(int index_ricerca = 0;index_ricerca<parametriDaCercare.length;index_ricerca++){
				
				// DICHIARO CHE NON DEVE AGGIUNGERE LA RIGA
				rigaDaAggiungere = false;
				
				// CONTROLLO SE RICERCA NO CASE SENSITIVE
				if(jCheckBox_CaseSensitive.isSelected() == false){
					
					// CONTROLLO SE TROVA LA TRACCIA NO CASE SENSITIVE
					if(riga.toUpperCase().indexOf(parametriDaCercare[index_ricerca].toUpperCase()) >= 0){
						// SE NON DEVE CERCARE TUTTI I TERMINI AGGIUNGE LA RIGA ED ESCE DAL CICLO
						if(jCheckBox_CercaTutto.isSelected() == false){
							rigaDaAggiungere = true;
							break;
						}else{
							rigaDaAggiungere = true;
						}
					}else{ // SE NON TROVA LA TRACCIA
						// SE DEVE CERCARE TUTTI I TERMINI NON AGGIUNGE LA RIGA ED ESCE DAL CICLO
						if(jCheckBox_CercaTutto.isSelected()==true){
							rigaDaAggiungere = false;
							break;
						}
					} // FINE CONTROLLO SE TROVA LA TRACCIA NO CASE SENSITIVE
					
				}else{ // SE LA RICERCA TRACCIA CASE SENSITIVE
					
					// CONTROLLO SE TROVA LA TRACCIA
					if(riga.indexOf(parametriDaCercare[index_ricerca]) >= 0){
						// SE NON DEVE CERCARE TUTTI I TERMINI AGGIUNGE LA RIGA ED ESCE DAL CICLO
						if(jCheckBox_CercaTutto.isSelected()==false){
							rigaDaAggiungere = true;
							break;
						}else{
							rigaDaAggiungere = true;
						}
					}else{ // SE NON TROVA LA TRACCIA
						// SE DEVE CERCARE TUTTI I TERMINI NON AGGIUNGE LA RIGA ED ESCE DAL CICLO
						if(jCheckBox_CercaTutto.isSelected()==true){
							rigaDaAggiungere = false;
							break;
						}
					} // FINE CONTROLLO SE TROVA LA TRACCIA NO CASE SENSITIVE

				} // FINE CONTROLLO CASE SENSITIVE
				
			} // FINE CICLO PER OGNI VOCE DELLA TRACCIA
			
			// CONTROLLO SE LA RIGA è DA AGGIUNGERE O NO
			if (rigaDaAggiungere==true){
				
				System.out.println(riga);
				risultatiRicerca = risultatiRicerca + (riga + "\n");

			}

		} // FINE CICLO PER OGNI RIGA
		
		jTextArea_RisultatiRicerca.setText(risultatiRicerca);
		
	}

**Andrea1979** · 22-06-2007, 18:44

Potresti provare con RandomAccessFile e leggere una porzione di file alla volta (skippando con seek). Dovresti però pensare ad un modo per leggere le righe per intero (nel senso che se skippy 50000 bytes e finisci in mezzo ad una riga dovresti cominciare la lettura dal fine riga precedente e idem per la posizione di arresto di lettura)

**morphy79** · 22-06-2007, 18:57

scusa ma non ho capito...

**Andrea1979** · 22-06-2007, 18:58

Come apri il file? Se usi RandomAccessFile per accedere al file puoi decidere quanto leggerne e da che punto. In altre parole, decidi una dimensione, 100KB per esempio, e leggi 100KB alla volta. Su questi 100KB esegui le tue verifiche.

**morphy79** · 25-06-2007, 10:34

lo apro così...

codice:

	public static String read(String fileToSend) throws IOException {

		String nextLine = "";
		String lineSep = System.getProperty("line.separator");
		FileReader f = new FileReader(fileToSend);
		BufferedReader br = new BufferedReader(f);
		StringBuffer sb = new StringBuffer();
		while((nextLine = br.readLine()) != null) 
		{
			sb.append(nextLine);
			sb.append(lineSep);
		} // FINE WHILE
		
		br.close();
		f.close();
		
		return(sb.toString());
	}

e mi sa che è proprio qui che il programma va lento... perchè il semplice controllo index of non mi sembra che crei problemi particolari...

**Andrea1979** · 25-06-2007, 20:36

Originariamente inviato da Andrea1979
Potresti provare con RandomAccessFile e leggere una porzione di file alla volta (skippando con seek). Dovresti però pensare ad un modo per leggere le righe per intero (nel senso che se skippy 50000 bytes e finisci in mezzo ad una riga dovresti cominciare la lettura dal fine riga precedente e idem per la posizione di arresto di lettura)

**morphy79** · 26-06-2007, 11:37

invece no... è proprio quando la stringa su ogni riga.. la lettura è molto veloce specialmente così :

codice:

		String fileContent = "";
		String file = jTextField_PathFile.getText();
		long start = System.currentTimeMillis();
		try{
			ByteArrayOutputStream os = new ByteArrayOutputStream();
			InputStream is = new FileInputStream(file);
			byte[] buffer = new byte[1024];// Or some length
			for (int count = 0; (count = is.read(buffer)) != -1;)
			    os.write(buffer, 0, count);
			os.close();
			is.close();
			fileContent = os.toString("utf-8"); // or whatever encoding the file is
		}catch(Exception ie){
			ie.printStackTrace();
		}
		long elapsed = System.currentTimeMillis() - start;
        System.out.println("Tempo impiegato : " + elapsed);

adesso il problema è la query vera e propria..
se splitto e faccio riga per riga non mi passa più...

forse sarebbe meglio cercare su tutto il testo con indexOf e quando trovo la Stringa recuperare l'inizio riga e riportarla nella textArea, proseguendo la ricerca dal punto successivo..

qualche idea migliore ??? andrea non ho capito il tuo quote !!!

**Andrea1979** · 26-06-2007, 12:46

Se tu apri 50000 righe di file quello si crea un oggetto con 50000 righe e su quelle 50000 righe ogni volta andrà a fare le sue ricerche e operazioni. Il mio suggerimento è: apri 100 righe, fai le tue cose, chiudi, apri le 100 righe successive etc etc.

**morphy79** · 27-06-2007, 12:47

capito !!! infatti ora va meglio !!!
grazie !!!

**Andrea1979** · 27-06-2007, 12:50

M prego! Vaya con Cornholio!

Discussione: [java] split file grosse dimensioni

Strumenti discussione

Ricerca discussione

Visualizza

[java] split file grosse dimensioni

Permessi di invio