Sto cercando di far funzionare questo script per fare il prase dell' html
ma non riesco a farmi restituire il valore del nodo p con il giusto encoding del testo
il codice è :
Codice PHP:
$html = '<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<title>Untitled Document</title>
</head>
<body>
Questo è un paragrafo chissà sè saranno convetitì i cartterì o nò!?</p>
</body>
</html>';
// parse dell html in DOMDocument
$dom = new DOMDocument();
$dom->loadHTML($html);
echo "ENCODING: " . $dom->actualEncoding;
$items = $dom->getElementsByTagName ('p');
foreach (($dom->getElementsByTagName ('p')) as $item) {
echo $item->nodeValue . "\n";
}
ma il risultato che mi dà è:
ENCODIG:iso-8859-1 - Questo è un paragrafo chissà sè saranno convetitì i cartterì o nò!?
che non è proprio di facile lettura
qualche suggerimento ??