Visualizzazione dei risultati da 1 a 4 su 4
  1. #1
    Utente di HTML.it L'avatar di dottwatson
    Registrato dal
    Feb 2007
    Messaggi
    3,012

    estrarre testi da qualsiasi tag in pagina html

    buongiorno.. non sono molto efferrato nelle regexp ma mi impegno


    ho cercato svariate volte in google ma nessun risultato soddisfa le mie necessità.

    ho un apagina html e vorrei estrarre TUTTI i testi contenuti nell apagina.

    purtroppo non posso utilizzare strip_tags in quanto deve poter 'indicizzare' i risultati , quandi ottenere un array sarebbe il top!

    premetto che ho utilizzato anche l' esempio base della guida php su preg_mach_all ma fallisce....

    qualcuno riesce ad aiutarmi??

    grassie

    Non sempre essere l'ultimo è un male... almeno non devi guardarti le spalle

    il mio profilo su PHPClasses e il mio blog laboweb

  2. #2
    Come partenza potresti usare un codice come questo:

    Codice PHP:
    <pre>
    <?php 

    function not_empty($content) {
        return !empty(
    $content);
    }

    $url 'http://www.masteringlandingpages.com/'// your web page url/path
    $content file_get_contents($url);

    $content utf8_decode($content); // just an example of content preparation

    // clean up "strange" tags
    $content preg_replace('#<script[^>]*>.*?</script[^>]*>#si'''$content);
    $content preg_replace('#<style[^>]*>.*?</style[^>]*>#si'''$content);
    $content preg_replace('##si'''$content);

    $results = array();
    $content '<root>' $content '<root>'// fake tags for easier regexp
    $pattern '#>([^<]*)<#si';
    if (
    preg_match_all($pattern$content$matches)) {
        foreach (
    $matches[1] as $match) {
            
    $match str_replace(''' '$match); // just an example of normalization task
            
    $match trim($match); // just an example of normalization task
            
    $results[] = $match;
        }
    }

    $results array_filter($results'not_empty'); // remove not empty tags

    print_r($results);

    ?>
    </pre>

  3. #3
    Utente di HTML.it L'avatar di dottwatson
    Registrato dal
    Feb 2007
    Messaggi
    3,012
    riadattata e funziona egregiamente

    molte very grassie
    Non sempre essere l'ultimo è un male... almeno non devi guardarti le spalle

    il mio profilo su PHPClasses e il mio blog laboweb

  4. #4
    Salve a voi tutti,

    e Risultati vengano visualizzati in questo modo:

    -------------------------------
    Array
    (
    [5] => prova
    [25] => prova 3 prova forsa
    [58] => Marzo 2009
    -------------------------------

    come divo fari per averli in questo modo <= .

    Array
    (
    [5] => prova <=
    [25] => prova 3 prova forsa <=
    [58] => Marzo 2009 <=
    -------------------------------

    grazie tanti

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.