Ciao a tutti, tempo fa avevo postato un argomento sul come criptare con delle XXX i numeri di telefono, ora ho utilizzato ciò che ho applicato in quel caso per ricreare un web crawler che estraesse da una pagina web tutti i numeri di telefono presenti (lo stesso l'ho fatto con le e-mail e funziona egregiamente).

Ecco il codice:

Codice PHP:
function getPhoneNumber($txt) {
        
$regexp '/([+\\s]){1,3}([0-9\\s]{2,5})-?([0-9\\s]{2,5})-?([0-9\\s]{2,20})/';
        
        
preg_match_all($regexp$txt$m);
        
        
        return isset(
$m[0]) ? $m[0] : array(); 
    }
    
$fulltxt file_get_contents('http://wiki.wikimedia.it/wiki/Contatti');
$phonenumber getPhoneNumber($fulltxt);
print_r ($phonenumber); 
il problema è che funziona solo a metà ... ovvero a parte che ottengo diversi risultati "vuoti" non funziona comunque con tutte le possibilità ...

ecco il risultato:
Array ( [0] => [1] => [2] => [3] => [4] => [5] => 02700400379 [6] => 0395962256 [7] => 20900 [8] => [9] => [10] => [11] => [12] => [13] => [14] => [15] => [16] => [17] => [18] => [19] => [20] => [21] => [22] => [23] => [24] => [25] => )

Come mai vengono individuati tutti quei record vuoti???? dove sbaglio?