Ciao a tutti, tempo fa avevo postato un argomento sul come criptare con delle XXX i numeri di telefono, ora ho utilizzato ciò che ho applicato in quel caso per ricreare un web crawler che estraesse da una pagina web tutti i numeri di telefono presenti (lo stesso l'ho fatto con le e-mail e funziona egregiamente).
Ecco il codice:
Codice PHP:
function getPhoneNumber($txt) {
$regexp = '/([+\\s]){1,3}([0-9\\s]{2,5})-?([0-9\\s]{2,5})-?([0-9\\s]{2,20})/';
preg_match_all($regexp, $txt, $m);
return isset($m[0]) ? $m[0] : array();
}
$fulltxt = file_get_contents('http://wiki.wikimedia.it/wiki/Contatti');
$phonenumber = getPhoneNumber($fulltxt);
print_r ($phonenumber);
il problema è che funziona solo a metà ... ovvero a parte che ottengo diversi risultati "vuoti" non funziona comunque con tutte le possibilità ...
ecco il risultato:
Array ( [0] => [1] => [2] => [3] => [4] => [5] => 02700400379 [6] => 0395962256 [7] => 20900 [8] => [9] => [10] => [11] => [12] => [13] => [14] => [15] => [16] => [17] => [18] => [19] => [20] => [21] => [22] => [23] => [24] => [25] => )
Come mai vengono individuati tutti quei record vuoti???? dove sbaglio?