Visualizzazione dei risultati da 1 a 3 su 3
  1. #1
    Utente di HTML.it
    Registrato dal
    Oct 2011
    Messaggi
    177

    [Java][Database]Problemi di inserimento testo nel db

    Salve sto usando un database access per un applicazione in java. Tale applicazione carica pagina per pagina tutto il testo di un file pdf. Le pagine (testo su stringa) che contenevano il carattere <'> non venivano caricate, allora ho eliminato il carattere dal testo con il comando .replaceAll("'", " "). Il problemao è stato risolto per molte pagine ma altre non vengono ancora caricate, quando vado ad analizzare il testo inserito mi da sempre quel carattere speciale come primo elemento della stringa, in oltre verificando sul pdf ho notato che tale carattere non è presente nella pagina. Come posso risolvere tale problema?
    Teo

  2. #2
    Utente di HTML.it
    Registrato dal
    Aug 2002
    Messaggi
    8,013
    PreparedStatement dovrebbe venirti in aiuto, se non ricordo male si occupa di fare "l'escape" dei caratteri speciali in automatico.

    EDIT: a meno che i caratteri "speciali" e non voluti non siano frutto di un rip mal riuscito del testo contenuto nel PDF, nel qual caso, bisognerà trovare qualcosa di più solido a livello di regex per ripulire il testo.
    <´¯)(¯`¤._)(¯`»ANDREA«´¯)(_.¤´¯)(¯`>
    "The answer to your question is: welcome to tomorrow"

  3. #3
    Utente di HTML.it
    Registrato dal
    Oct 2011
    Messaggi
    177
    Come dovrei usare il PreparedStatement. Vi do qualche informazione in più per farvi capire meglio il problema.
    Al database mi connetto tramite un bridge JDBC-ODBC Class.forName("sun.jdbc.odbc.JdbcOdbcDriver"), il problema appare quando vado ad eseguire la query di inserimento.
    codice:
    try {
              Statement stmt = con.createStatement();
      	  stmt.executeUpdate(query);
              stmt.close();
        }catch(SQLException s){ 
        	  System.out.println(">>  Errore durante l'esecuzione della query di inserimento");
            }
    se vado a stampare il valore della stringa query inizia con il carattere che mi da il problema e che non riesco ad eliminare.
    Il testo viene estratto con PdfTextExtractor.getTextFromPage(lettore, pagina) dove lettore è il pdf e pagina è il numero della pagina. Tali testo viene ripulito con il metodo
    codice:
    private String pulisciStringa(String testo) {
      return testo.replaceAll("'", " ").replaceAll("\\s+", " ");}
    che non riesce ad eliminare quel primo elemento. Io penso sia un carattere special dei pdf che da problemi e che si genera al momento dell'estrazzione.
    Teo

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.