Visualizzazione dei risultati da 1 a 3 su 3
  1. #1

    leggere i link scritti in una pagina

    Sto revisionando il mio sito e vorrei eliminare molti files inutilizzati.
    Per fare questo:
    Leggo tutti i files della cartella con glob($folder."*.{htm,html,php}",GLOB_BRACE)
    Leggo il contenuto dei vari files con file_get_contents
    A questo punto vorrei vedere se nella pagina letta c'è qualche link del tipo
    Calendario
    oppure
    2 gestione db
    A questo punto vorrei recuperare le sole pagine (con o senza il nome della cartella) indicate nei link e stamparle a video:
    mikevba061.htm
    gestione_db.php
    Penso sia necessario impostare una espressione regolare per leggere tutti il link nella pagina ma non non so come fare.

    Grazie per l'aiuto.

  2. #2
    Ecco:
    qui nel forum ho trovato e leggermente modificato le istruzioni contenute in questo indirizzo in questo modo
    Codice PHP:
        $pattern '#[url="([^"]]*>([^<]*)[/url]#';
        
    preg_match_all($pattern$content$matchesPREG_SET_ORDER);
        foreach(
    $matches as $match) {
        echo 
    htmlentities ($match[0]) . "
    \n"

    ma non funziona per due motivi
    mi restituisce una cosa del genere (non mi restituisce la sola pagina che vorrei leggere)
    non mi restituisce tutti i link (non so perchè ma ne mancano molti)


  3. #3
    Dunque.
    Tra tutte quelle che ho provato oggi, ci sarebbe questa che mi soddisfa maggiormente
    Codice PHP:
    $pattern "/<a\s[^>]*href\s*=\s*(\"??)([^\" >]*?)\\1[^>]*>(.*)<\/a>/siU"
    che mi restituisce qualcosa come:
    Però ancora non ci sono.
    A parte il primo risultato che mi interessa poco perchè si riferisce ad una immagine, per gli altri mi sarebbe comodo che mi venga restituito il solo nome della pagina
    mikevba075.htm
    mikevba079.htm
    mikevba096a.htm
    o comunque tutto quel che si trova tra gli apici di href.

    Potete aiutarmi? magari con una seconda espressione regolare da applicare al risultato della prima.

    Grazie
    (scusate l'estensione .htm, ma si tratta di vecchie pagine che hanno una certa indicizzazione
    e non mi conviene cambiarle, almeno ora)

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.