ciao a tutti,
ho un testo contenente una serie di link o di riferimenti a pagine html, asp ecc.
ho necessità di estrarre da questo tutti gli url che contiene e volevo farlo con le regexp, ma ho qualche problema con il pattern.. per ora con questo riesco ad estrarre le estensioni delle pagine, ma non so come prendere la parte prima (nome della pagina ed eventuali cartelle):
gli url sono del tipo:codice:re.Pattern = "(\.asp|\.html|\.htm|\.js|\.css|\.inc|\.vbs)"
pagina.htm
../cartella/pagina.asp
http://dominio/cartella/pagina.html
ecc
edit:
@roby: si può aggiungere qualcosa del genere?
Segnala questo messaggio a Willybit

Rispondi quotando
