Allora ho trovato questo script in php che fa lo scraping dei link in una determinata pagina che decido io e li inserisce in un database. Io voglio però che il risultato dello scraping non siano link come:

http://nomdedominio.it/members.php

io voglio che sia solo

http://nomedominio.it

ho trovato diversi modi di fare stripping ma non ci sono riuscito, e non ho una minima idea di come si possa fare, vi pasto il codice:

Codice PHP:
<?php

$db_host 
"localhost";
$db_user "ODBC";
$db_password "";
$db_name "ODBC";
$db mysql_connect($db_host$db_user$db_password);

mysql_select_db($db_name$db)
or die (
"Errore nella selezione del database.");

function 
storeLink($url,$gathered_from) {
    
$query "INSERT INTO links (url, gathered_from) VALUES ('$url', '$gathered_from')";
    
mysql_query($query) or die('Error, insert query failed');
}

$target_url "http://notsecurity.com/";
$userAgent 'Googlebot/2.1 ([url]http://www.googlebot.com/bot.html[/url])';

// make the cURL request to $target_url
$ch curl_init();
curl_setopt($chCURLOPT_USERAGENT$userAgent);
curl_setopt($chCURLOPT_URL,$target_url);
curl_setopt($chCURLOPT_FAILONERRORtrue);
curl_setopt($chCURLOPT_FOLLOWLOCATIONtrue);
curl_setopt($chCURLOPT_AUTOREFERERtrue);
curl_setopt($chCURLOPT_RETURNTRANSFER,true);
curl_setopt($chCURLOPT_TIMEOUT10);
$htmlcurl_exec($ch);
if (!
$html) {
    echo 
"
cURL error number:" 
.curl_errno($ch);
    echo 
"
cURL error:" 
curl_error($ch);
    exit;
}

// parse the html into a DOMDocument
$dom = new DOMDocument();
@
$dom->loadHTML($html);

// grab all the on the page
$xpath = new DOMXPath($dom);
$hrefs $xpath->evaluate("/html/body//a");

for (
$i 0$i $hrefs->length$i++) {
    
$href $hrefs->item($i);
    
$url $href->getAttribute('href');
    
storeLink($url,$target_url);
    echo 
"
Link stored: 
$url";
}
mysql_close($db);
?>
come strippare?