Visualizzazione dei risultati da 1 a 4 su 4
  1. #1

    Problema scraper in php

    Ciao a tutti , sono alle prime armi e sto cercando di fare uno scraper che mi servirebbe per il mio sito web, lo scraper dovrebbe prelevare questa testo: "Segnalibri 3D - Lupo nella Neve"
    da questa porzione di codice:
    codice:
    <tbody><tr>
                <td class="pageHeadingProduct" valign="top"><h1>Segnalibri 3D - Lupo nella Neve</h1>
    <span class="smallText"> Codice Prodotto BOOK05</span>
    
    </td>
              </tr>
            </tbody>
    Ho provato in questa maniera ma lo script mi restituisce sempre l' errore "Name not found"

    codice:
    // name
    			if (preg_match('~<td[^>]*?class="pageHeadingProduct"[^>]*>([^<]+)~is', $content, $m)) {
    			
    				$item['Name'] = trim(html_entity_decode(strip_tags($m[1]), ENT_QUOTES, 'UTF-8'));
    			}
    			else {
    				$this->_log(MESSAGE, 'Name not found. Skip.');	
    				return;
    			}
    Please help me

  2. #2
    Devi correggere queste cose:

    - stai utilizzando dei caratteri speciali cioè '<', '>', '=' quindi devi farne l'escape ('\<', '\>', '\=');
    - '*?' non ha senso perché i due caratteri si escludono a vicenda;
    - puoi togliere 'class="pageHeadingProduct"' perché è anche lì non c'è nessun '>';
    - se vuoi il contenuto del tag 'td' devi anche verificare la fine del tag ('/td'; anche '/' è un carattere speciale), non solo l'inizio, altrimenti prendere tutto da "<td" in poi.

  3. #3
    Grazie per la risposta, ma io del Tag TD voglio solo la parte dentro il Tag "H1" ovvero "Segnalibri 3D - Lupo nella Neve"

  4. #4
    oltre a suggerirti cose tipo

    http://www.spaweditor.com/scripts/regex/

    per testare online le tue regular expressions, potresti anche pensare a

    http://php.net/manual/en/book.dom.php
    IP-PBX management: http://www.easypbx.it

    Old account: 2126 messages
    Oldest account: 3559 messages

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.