Visualizzazione dei risultati da 1 a 5 su 5
  1. #1

    Estrazione URL da variabile

    Ciao a tutti, io ho una variabile di tipo stringa che contiene il testo di una pagina html, e vorrei estrarre tutti gli url validi presenti in quella pagina, magari mettendoli in un array...mi sembra di aver capito che si potrebbe usare la funzione preg_match_all ma non ho una grande dimestichezza con le espressioni regolari anche se si tratta di una pagina html vorrei estrarre gli url indipendentemente dal tag href, semplicemente estrapolando tutte le stringhe che iniziano per "http://" e che terminano con ".html" o ".htm" o altre estensioni. qualcuno mi sa aiutare? grazie!

  2. #2
    Prova questa:
    codice:
    $html='testo html da cui estrarre gli url';
    $rex = '/(?:(?:ht|f)tps?:\/\/[^"\']+)|(?:[^"\']+\.(?:html?|php|asp|jsp?|css|xml)(?:\?[^"\']+|\/)?)/is';
    preg_match_all($rex,$html,$mth);
    echo '<pre>';
    print_r($mth[0]);
    :ciauz:
    dA .. foto di viaggio
    L'esperienza č il tipo di insegnante pių difficile.
    Prima ti fa l'esame, e poi ti spiega la lezione.

  3. #3
    mi da questo errore: Parse error: syntax error, unexpected ']' on line 19

    la linea 19 č quella dove viene definita l'espressione regolare ciaoč questa:

    $rex = '/(??:ht|f)tps?:\/\/[^"']+)|(?:[^"']+\.(?:html?|php|asp|jsp?|css|xml)(?:\?[^"']+|\/)?)/is';

  4. #4
    il forum si mangia gli escape (dell'apice singolo in questo caso):
    codice:
    $html='testo html da cui estrarre gli url';
    $rex = '/(?:(?:ht|f)tps?:\/\/[^"\\']+)|(?:[^"\\']+\.(?:html?|php|asp|jsp?|css|xml)(?:\?[^"\\']+|\/)?)/is';
    preg_match_all($rex,$html,$mth);
    echo '<pre>';
    print_r($mth[0]);
    dA .. foto di viaggio
    L'esperienza č il tipo di insegnante pių difficile.
    Prima ti fa l'esame, e poi ti spiega la lezione.

  5. #5
    Hey ora funziona alla grande grazie!!

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.