Buona Domenica a tutti,
Allora ho una domanda probabilmente stupida da porvi, ma sono alle prime armi col C# e in due giorni non ho cavato un ragno dal buco.
Sto realizzando un progettino per mio conto (avevo iniziato a scriverlo in Java, ma poi ho deciso di passare al C#, così da impararlo mentre lo realizzo ... forse) comunque, sostanzialmente io ho necessità di leggere il codice HTML di una pagina internet e di andarmi a cercare una serie di link (non tutti, solo alcuni posti all'interno di codice Javascript) e di salvarli altrove.
Tralasciando che, al momento, non mi interessi il salvataggio (una cosa per volta) io avevo pensato di "leggere" la pagina in questo modo (path è una variabile che contiene l'indirizzo della pagina da leggere):
e di utilizzare delle espressioni regolari per estrarre i link, utilizzando una cosa del genere:codice:WebClient client = new WebClient(); string dwnString = client.DownloadString(path);
Ho tralasciato per il momento che comunque io avrei più di un Match, ma per testare la bontà del codice al momento mi basta che mi vada a pescare il primo dei link che mi interessa ...codice:string regL = "<h1 class=\"no\"><a href=\"(.*?)\">"; Match m = Regex.Match(dwnString,regL);
Problema (di cui mi sono reso conto mentre scrivevo l'espressione, ma non ho trovato nulla in merito online ... e io nelle espressioni regolari riesco a perdermi sempre ...) così il codice mi prende il link E il codice Javascript che lo contorna, come posso fare per dirgli di prendere SOLO ciò che è racchiuso all'interno del codice Javascript? Secondariamente, esistono metodi migliori per fare ciò?
Grazie in anticipo a tutti, ciao!