Pagina 1 di 2 1 2 ultimoultimo
Visualizzazione dei risultati da 1 a 10 su 13
  1. #1

    script per pulire il testo importato da word

    'giorno!

    ho un problemino con l'importazione del testo in un sb mysql.

    il testo è contenuto in un file .html il problema sta nel fatto che molte volte il testo è stato copiato e incollato da word (tengo a precisare che non l'ho fatto io, qundi non datemi la colpa ) e sbattuto nella pagina senza tener conto delle schifezze che word si porta appresso.

    ora, l'importazione nel db l'ho fatta, ma quando vado a visualizzare il testo vedo tutti i caratteri "strani" che quel simpaticone di word si è portato appresso, quindi vedo una cosa del genere:

    "Tempo della Carne - Il Carnevale ovvero Levare la carneIl 17 gennaio inizia il far festa con il vecchio maiale dell'anno passato ed 蠩l Carnevale, cio蠩l levare la carne e banchettare. Cos젬'inizio del Carnevale eredita appieno la natura bifronte di Giano e del suo mese..."

    ecco quei caratteri strani che vedete sono quelli importati da word, io volevo chiedere esiste uno script che mi "ripulisca" da questi fastidi? o magari un'espressione regolare che riconosca questi caratteri e li converta nei relativi char html.

    io ho provato a fare un qualcosa del tipo htmlentities in inserimento e html_entity_decode in output, ma non risolvo niente.

    voi conoscete qualche alterntiva? e/o scappatoia?







    grazie mille!
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

  2. #2
    ho visto che ci sono le funzioni tidy ma non so se fanno al caso mio, e comunque non le posso intallare perché dovrei scaricarmi il package e ricompilare il php e non ho i permessi per farlo, quindi se esistono altre soluzioni sarebbe decisamente meglio
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

  3. #3
    Utente di HTML.it L'avatar di marco80
    Registrato dal
    May 2005
    Messaggi
    1,357
    Se hai il testo sotoforma di variabile prova ad usare mysql_escape_string($....); questo serve a levare strani scherzi durante l'inserimento nel db creati da accenti vari o simboli particolari..

  4. #4
    no! quello mi agigunge i caratteri di escape, ma quello già lo facevo.

    il mio problema è proprio sul charset...
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

  5. #5
    up
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

  6. #6
    capitato a me proprio oggi

    di solito uso FCKeditor, e per evitare che i clienti incollino zozzerie ho modificato il seguente settaggio nel config:

    FCKConfig.ForcePasteAsPlainText = true ;

  7. #7
    Originariamente inviato da troglos
    capitato a me proprio oggi

    di solito uso FCKeditor, e per evitare che i clienti incollino zozzerie ho modificato il seguente settaggio nel config:

    FCKConfig.ForcePasteAsPlainText = true ;

    uso anche io FCKEditor

    comunque, quello lo metto anche io a true, ma quello che intendo io è che il testo lo prendo da una pagina html e che la pagina html è stata fatta incollando pezzi da word...

    non c'è niente da fare? magari anche con le espressioni regolari, ma proprio non saprei nè che charset utilizzare nè come impostare la pregex


    il testo lo prendo da una pagina html perché all'inizo il sito era stato progettato statico, ma ora lo si vuole fare dinamico, quindi onde evitare di dover inserire 100 contenuti a mano, ho fatto uno script di importazione del testo in un db e fino a qui è tutto ok, non fosse per quei caratteri :master:
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

  8. #8
    io vorrei sapere perchè mi aggiunge un
    se edito un testo


  9. #9
    probabilmente la pagina html è utf8 e quindi quelli sono documenti in utf8

    prova utf8_decode sul testo ^^

  10. #10
    Originariamente inviato da daniele_dll
    probabilmente la pagina html è utf8 e quindi quelli sono documenti in utf8

    prova utf8_decode sul testo ^^

    Grazie mille!

    l'impressione è che ci stiamo avvicinando

    il testo che prima era pieno di quei caratteri "strani" usando utf8_decode ora lo vedo:

    Tempo della Carne - Il Carnevale ovvero Levare la carneIl 17 gennaio inizia il far festa con il vecchio maiale dell'anno passato ed ?l Carnevale, cio?l levare la carne e banchettare. Cos?'inizio

    ma mi sa che c'è ancora un passaggio che mi rimane oscuro, spero che non sia così anche per voi
    Talvolta anche una persona apparentemente inutile si rivela un abile samurai dalla forza di mille uomini, dimostrando di poter rinunciare alla vita e che il suo cuore si è completamente identificato con quello del suo padrone

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.