Questo sito utilizza cookies, anche di terze parti, per mostrare pubblicità e servizi in linea con il tuo account. Leggi l'informativa sui cookies.
Username: Password: oppure
C# / VB.NET - Leggere html C#
Forum - C# / VB.NET - Leggere html C#

Avatar
jaco94++ (Normal User)
Expert


Messaggi: 203
Iscritto: 22/10/2008

Segnala al moderatore
Postato alle 12:17
Martedì, 31/08/2010
Salve a tutti ....
sto sviluppando un programma che prenda da una pagina web i dati ricercati trammite una casella di testo e poi li visualizzi nel controllo webBrowser solo che la pagina web contine delle barre che vorrei eliminare e visualizzare solo il testo, quindi la mia domanda è :
Sarebbe possibile collegarsi ad una pagina web leggere il codice html eliminare delle parti e poi visualizzarlo sul controllo webBrowser ?


PM
Avatar
HeDo (Founder Member)
Guru^2


Messaggi: 2765
Iscritto: 21/09/2007

Up
1
Down
V
Segnala al moderatore
Postato alle 11:45
Giovedì, 02/09/2010
Testo quotato

Postato originariamente da jaco94++:

Sono riuscito a scaricare una copia in locale con:

Codice sorgente - presumibilmente C# / VB.NET

  1. WebClient web = new WebClient();
  2. return web.DownloadString(get);



e poi farla leggere al browser con

Codice sorgente - presumibilmente Plain Text

  1. webBrowser1.Document.Write(...);



per ora non ho modificato nulla volevo solo provarlo ma ho notato che non si riescono a vedere più le immagini c'è un modo per evitare che ciò accada ?



si, in pratica dopo aver caricato il DOM, bisogna cercare eventuali risorse esterne, come css, immagini, swf, etc... e scaricarle assieme alla pagina modificando i link di conseguenza. Un po quello che succede quando fai salva pagina con nome dal browser.

questo metodo offre più libertà ma è abbastanza articolato, consiglio invece di aprire la pagina direttamente nel webbrowser e modificare il DOM da lì.


Ingegnere Informatico
https://ldlagency.it
PM
Avatar
HeDo (Founder Member)
Guru^2


Messaggi: 2765
Iscritto: 21/09/2007

Up
0
Down
V
Segnala al moderatore
Postato alle 12:34
Martedì, 31/08/2010

ci sono due modi: il primo è scaricare tutto il contenuto della pagina, caricarlo in locale, togliere/fare/disfare in una copia locale e poi far puntare al webbrowser quella copia. il secondo è modificare il codice html presente nel webbrowser, a proposito leggi la guida di totem: http://totemslair.org/guide/viewchapter.php?guida=vb&id=79


Ingegnere Informatico
https://ldlagency.it
PM
Avatar
jaco94++ (Normal User)
Expert


Messaggi: 203
Iscritto: 22/10/2008

Up
0
Down
V
Segnala al moderatore
Postato alle 11:31
Giovedì, 02/09/2010
Sono riuscito a scaricare una copia in locale con:

Codice sorgente - presumibilmente C# / VB.NET

  1. WebClient web = new WebClient();
  2. return web.DownloadString(get);



e poi farla leggere al browser con

Codice sorgente - presumibilmente Plain Text

  1. webBrowser1.Document.Write(...);



per ora non ho modificato nulla volevo solo provarlo ma ho notato che non si riescono a vedere più le immagini c'è un modo per evitare che ciò accada ?

PM
Avatar
jaco94++ (Normal User)
Expert


Messaggi: 203
Iscritto: 22/10/2008

Up
0
Down
V
Segnala al moderatore
Postato alle 21:25
Martedì, 07/09/2010
Per rimuovere parte del sorgente html nel browser dovrei usare DocumentText.remove ho provato a dargli come partenza 0 e come fine 10 se non ho capito male dovrebbe eliminare i primi 10 caratteri nel sorgente ma non cambia nulla cosa sbaglio ?

PM
Avatar
Il Totem (Admin)
Guru^2


Messaggi: 3635
Iscritto: 24/01/2006

Up
0
Down
V
Segnala al moderatore
Postato alle 10:57
Mercoledì, 08/09/2010
Le stringhe in .NET sono oggetti immutabili. DocumentText.Remove non modifica DocumentText, ma restituisce una copia di DocumentText con i primi 10 caratteri eliminati.


"Infelici sono quelli che hanno tanto cervello da vedere la loro stupidità."
(Fligende Blatter)

"Dubitare di se stessi è il primo segno d'intelligenza."
(Ugo Ojetti)
PM