Ciao a tutti.
volendo fare un piccolo spider per un sito web statico, ho cercato in rete un sistema per leggere l'html delle pagine web.
La cosa che mi sembrava più corretta era l'uso del componente msinet.
Il codice che dovrei usare per leggere l'html è il seguente

'Da modificare l'url o acquisirla col metodo POST o GET
url = "http://www.mongeinformatica.it/"

'Creazione Istanza Controllo Inet
Set inet = Server.CreateObject("InetCtls.Inet.1")
Inet.protocol = 4 'HTTP
Inet.remoteport = 80
Inet.accesstype = 1 'Direct connection to internet
Inet.requesttimeout = 60 'in seconds

'Timeout
inet.RequestTimeOut = 20

inet.Url = url

'Download della pagina web
sHTML = inet.OpenURL()

'Regular expression (è un esempio)
Set rText = New regexp
rText.Pattern = "<H1>(.*)<\/H1>"
rText.Global = False
rText.IgnoreCase = True
'Esecuzione della regular expression nel codice HTML
Set objCols = rText.Execute( sHTML )

For Each objMatch in objCols
sText = sText & objMatch.Value
Next

'Pulisce tutto
Set rText = Nothing
Set objCols = Nothing

'E' un esempio
sText = Replace(Replace(sText, "<H1>", ""), "</H1>", "")

%>
<HTML>
<HEAD>
<TITLE>Pagina prelevata</TITLE>
</HEAD>
<BODY>



La pagina è <%=sText %></P>
<%response.write(inet.responsecode)%>
<%response.write(inet.responseinfo)%>

</BODY>
</HTML>
il componente sul server (win2003) dovrei averlo attivato correttamente dal component services.
L'ultima riga mi restituisce "12007" "Name not resolved".
Il problema potrebbe essere che uso questo script in locale? Per vedere i siti web del mio server locale imposto un proxy sulla connessione di IE.

Grazie mille a chiunque mi dia una mano