Visualizzazione dei risultati da 1 a 4 su 4
  1. #1

    Codifica caratteri siti esterni

    Ciao,
    ho un sistema che prende il testo da alcuni siti e poi esegue un parsing con varie espressioni regolari.

    I file sono due, un index.html (in cui l'utente inserisce l'url del sito e alcune keyword da ricercare) e un process.php in cui viene appunto estratto il contenuto ed eseguito il parsing.

    Il problema è la codifica dei caratteri.
    Avevo settato sia l'index.html sia il process.php in UTF-8 e, con siti unicode, tutto funzionava.

    Se però vado a prendere in input un sito con ad esempio charset ISO 8859-1/occidentale, le keyword non vengono trovate.

    Come posso risolvere?

  2. #2
    Per ora sto facendo cosi:

    - index.html (il form) è su una pagina utf8
    - process.php riconosce se l'url da aprire è utf8 o meno e, in caso negativo, converte la stringa con utf8_encode.

    Sembra funzionare, unico problema lo riscontro se l'url ha dei "" .. se li vado a stampare, mi esce un carattere tutto strano.. in compenso gli accenti li prende benissimo

    edit: casomai servisse a qualcuno, la funzione che riconosce se una stringa è UTF8 l'ho trovata qui
    http://it2.php.net/manual/en/function.utf8-encode.php
    è quella di "bitseeker"

  3. #3
    Utente di HTML.it
    Registrato dal
    Oct 2008
    Messaggi
    270
    sembra ke tu abbia risolto il mio problema

    mi puoi dare una mano?
    http://forum.html.it/forum/showthrea...readid=1351846

  4. #4
    Utente di HTML.it L'avatar di nicola75ss
    Registrato dal
    Nov 2004
    Messaggi
    12,922
    @Cypher86: hai già aperto un thread tuo a riguardo. Continua lì per cortesia.

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.