Ciao a tutti, stò realizzando un piccolo spider d'immagini che scandaglia qualche sito selezionato ottenendo l'URL delle immagini stesse.
Quando lo lancio e se nel cosice HTML in "src" è indicato l'URL completo funziona tutto a dovere. Il problema giunge se nel codice "src" vi è una posizione parziale tipo ../immagini/miaimmagine.jpgcodice:<?php function getImageFromPage($url){ $myVar = file_get_contents($url); $doc = new DOMDocument; $doc->loadHTML($myVar); $xpath = new DOMXPath($doc); $nodo = $xpath->query('//img[@src]'); return $nodo; } $URL = "http://www.miosito.it/miadirectory/subdirectory"; $nodo = getImageFromPage($URL); foreach ($nodo as $nodo){ $imgsrc = $nodo->getAttribute('src'); $imgalt = $nodo->getAttribute('alt'); $path_parts = pathinfo($imgsrc); echo $imgsrc; } ?>
In tal caso il sistema non riesce ad individuare la reale posizione dell'immagine nel web.
Qualche soluzione????![]()

Rispondi quotando