Buona Domenica a tutti,
Allora ho una domanda probabilmente stupida da porvi, ma sono alle prime armi col C# e in due giorni non ho cavato un ragno dal buco.
Sto realizzando un progettino per mio conto (avevo iniziato a scriverlo in Java, ma poi ho deciso di passare al C#, così da impararlo mentre lo realizzo ... forse) comunque, sostanzialmente io ho necessità di leggere il codice HTML di una pagina internet e di andarmi a cercare una serie di link (non tutti, solo alcuni posti all'interno di codice Javascript) e di salvarli altrove.
Tralasciando che, al momento, non mi interessi il salvataggio (una cosa per volta) io avevo pensato di "leggere" la pagina in questo modo (path è una variabile che contiene l'indirizzo della pagina da leggere):
e di utilizzare delle espressioni regolari per estrarre i link, utilizzando una cosa del genere:codice:WebClient client = new WebClient(); string dwnString = client.DownloadString(path);
Ho tralasciato per il momento che comunque io avrei più di un Match, ma per testare la bontà del codice al momento mi basta che mi vada a pescare il primo dei link che mi interessa ...codice:string regL = "<h1 class=\"no\"><a href=\"(.*?)\">"; Match m = Regex.Match(dwnString,regL);
Problema (di cui mi sono reso conto mentre scrivevo l'espressione, ma non ho trovato nulla in merito online ... e io nelle espressioni regolari riesco a perdermi sempre ...) così il codice mi prende il link E il codice Javascript che lo contorna, come posso fare per dirgli di prendere SOLO ciò che è racchiuso all'interno del codice Javascript? Secondariamente, esistono metodi migliori per fare ciò?
Grazie in anticipo a tutti, ciao!

) comunque, sostanzialmente io ho necessità di leggere il codice HTML di una pagina internet e di andarmi a cercare una serie di link (non tutti, solo alcuni posti all'interno di codice Javascript) e di salvarli altrove.
) così il codice mi prende il link E il codice Javascript che lo contorna, come posso fare per dirgli di prendere SOLO ciò che è racchiuso all'interno del codice Javascript? Secondariamente, esistono metodi migliori per fare ciò?
Rispondi quotando
... in ogni caso questo è un prototipo (dove ho generalizzato i valori, ma è un dettaglio) del codice che devo trovare (del resto non me ne frega un tubo
)
Il problema ora è che questi link hanno anche uno o più spazi anche nel titolo (al contrario dell'attributo class che al massimo ha uno spazio) producendo quindi lo stesso problema di prima (siccome non vede la chiusura del tag) ma mi sa che ci penserò dopo pranzo
