Visualizzazione dei risultati da 1 a 5 su 5

Discussione: html per laurearmi

  1. #1

    html per laurearmi

    ciao a tutti...
    avrei bisogno di un suggerimento per poter procedere nella realizzazione del mio programmino per la tesi..
    Vorrei sapere come posso riconoscere se un url punta ad una risorsa html/htm/shtml senza dover aprire una connessione verso quell'url.
    Che io sappia i seguenti indirizzi sono "ad occhio" html

    http://www.math.unipd.it
    http://www.math.unipd.it/orario
    http://www.math.unipd.it/orario.htm
    http://www.consvancouver.esteri.it/C...ancouver/Menu/

    questi però sono semplici. nel caso invece di
    http://www.fondopriamo.it/normativa.php?c=34
    http://www.pensionilex.kataweb.it/ar...60&idArt=26715
    http://www.enpam.it/pls/portal/url/I...30A8C0070020A9

    c'è un modo per dire se sono html??
    insomma...a me interesserebbe capire le codifiche degli url che puntano a risorse ESCLUSIVAMENTE html/htm/shtml

    vi ringrazio. Alessandro

  2. #2
    Utente di HTML.it L'avatar di ivy_76
    Registrato dal
    Dec 2004
    Messaggi
    1,822
    Non ho ben capito il tuo problema... gli indirizzi li hai in una tabella e devi solo controllare se hanno un' estesione HTML ?
    Se fosse cosi ti basta fare una ricerca negli URL per le parole HTML e cosi via.
    TORTA DI RISO .. F I N I T A !!

    Da M.C.S.A. a impiegato pubblico :-(

  3. #3
    Utente di HTML.it
    Registrato dal
    Jan 2002
    Messaggi
    220
    Ciao,
    le prime che indichi sono semplici da capire e probabilmente puntano a indirizzi html anche se la certezza non la hai in due casi:

    http://www.math.unipd.it/orario

    Qui punti a una directory e in questo caso è il server ha fornire all'utente che si collega a questo indirizzo la pagina che il webmaster ha preparato per lui che può essere HTML e quindi ti verrà inviata la pagina index.htm oppure potrebbe essere anche ASP e allora ti verrà inviata la pagina default.asp. Ti parlo di queste due pagine perchè sono quelle che vengono inviate se nell'indirizzo non è stata specificata proprio la pagina esatta, il web server allora cerca e invia le pagine con nomi di quel tipo.

    Analizziamo ora le pagine più "difficili"

    http://www.fondopriamo.it/normativa.php?c=34

    Questo è facilissimo... non è ne HTML ne ASP ma è PHP e lo vedi dall'estensione nella pagina normativa.

    http://www.pensionilex.kataweb.it/ar...60&idArt=26715

    Idem qui, lo vedi dall'estensione che in questo caso è JSP che altro non è che una cosa simile al ASP, se vuoi vedere di cosa si tratta vai qui

    http://www.enpam.it/pls/portal/url/I...30A8C0070020A9

    In questo caso non abbiamo un file con estensione per cui sembrerebbe di nuovo una directory... a questo punto sta dinuovo al web server cercare un file index.html o default.asp o altri nomi di quelli standard che per il caso del php potrebbe essere di nuovo default.php ma non lo so con certezza. Comunque per ogni linguaggio e quindi per ogni estensione esiste un documento di default che viene visualizzato se nel indirizzo manca il nome esatto del documento ma viene indicato, come in questo caso, solo la directory dove risiede.

  4. #4
    Frontend samurai L'avatar di fcaldera
    Registrato dal
    Feb 2003
    Messaggi
    12,924
    http://www.math.unipd.it
    http://www.math.unipd.it/orario

    su questi due indirizzi poi non puoi stabilirlo a priori... dipende in che modo il webserver è stato istruito a rispondere

    ...se un url punta ad una risorsa html/htm/shtml senza dover aprire una connessione verso quell'url...
    sei sicuro che questa sia la condizione esatta? O piuttosto intendevi dire senza aprire la pagina su una finestra del browser? O forse intendevi dire che non puoi fare un GET della risorsa?

    Perchè se ci fosse qualche scappatoia magari ci si potrebbe lavorare su...
    Vuoi aiutare la riforestazione responsabile?

    Iscriviti a Ecologi e inizia a rimuovere la tua impronta ecologica (30 alberi extra usando il referral)

  5. #5

    mi spiego meglio...

    vi spiego cosa dovrebbe fare questo modulo del mio programmino così magari mi sapete indicare meglio.

    -io ho una serie di pagine internet salvate sul disco
    -da ogni pagina io estraggo gli href, li salvo in un file
    -tra tutti questi href devo selezionare solamente quelli che puntano ad una risorsa htm, html o
    shtml.
    -dopo averli selezionati, scarico il codice sorgente htm, html o shtml e lo do in input ad un parser
    che conta il numero di tag ecc...succo del discorso, le pagine devono essere html, htm o shtml.


    vorrei, data la lista di href, poter escludere quelli che sicuramente non sono html, htm o shtml...
    suggerimenti?? grazie 1000

Permessi di invio

  • Non puoi inserire discussioni
  • Non puoi inserire repliche
  • Non puoi inserire allegati
  • Non puoi modificare i tuoi messaggi
  •  
Powered by vBulletin® Version 4.2.1
Copyright © 2025 vBulletin Solutions, Inc. All rights reserved.