Ciao a tutti, stò realizzando un piccolo spider d'immagini che scandaglia qualche sito selezionato ottenendo l'URL delle immagini stesse.
codice:
<?php
function getImageFromPage($url){
$myVar = file_get_contents($url);
$doc = new DOMDocument;
$doc->loadHTML($myVar);
$xpath = new DOMXPath($doc);
$nodo = $xpath->query('//img[@src]');
return $nodo;
}
$URL = "http://www.miosito.it/miadirectory/subdirectory";
$nodo = getImageFromPage($URL);
foreach ($nodo as $nodo){
$imgsrc = $nodo->getAttribute('src');
$imgalt = $nodo->getAttribute('alt');
$path_parts = pathinfo($imgsrc);
echo $imgsrc;
}
?>
Quando lo lancio e se nel cosice HTML in "src" è indicato l'URL completo funziona tutto a dovere. Il problema giunge se nel codice "src" vi è una posizione parziale tipo ../immagini/miaimmagine.jpg
In tal caso il sistema non riesce ad individuare la reale posizione dell'immagine nel web.
Qualche soluzione????