Questo sito utilizza cookies, anche di terze parti, per mostrare pubblicità e servizi in linea con il tuo account. Leggi l'informativa sui cookies.
Username: Password: oppure
C# / VB.NET - selezionare testo da carattere a carattere HTML
Forum - C# / VB.NET - selezionare testo da carattere a carattere HTML

Avatar
jeremy23 (Normal User)
Newbie


Messaggi: 3
Iscritto: 05/01/2014

Segnala al moderatore
Postato alle 17:57
Domenica, 05/01/2014
Salve a tutti,

sono nuovo di VB.Net ma sto cimentandomi in qualche esperimento... se dico qualche sciocchezza spero mi perdonerete! :)

Ho scritto un codice in VB.net e all'interno di un testo HTML plottato in una TextBox, avrei la necessità di:
1) epurare le parti di testo che non mi interessano, sapendo che gli spezzoni di stringa che vorrei sono sempre collocati fra un numero e il simbolo parentesi come qui sotto:
"12:45 Testo di interesse (altre cose)"
a me interesserebbe la parte "Testo di interesse" collocato fra il carattere numerico "5" e la "(".
2) inoltre vorrei chiedervi se qualcuno sa come rimuovere dal testo HTML il simbolo rettangolare che sinceramente ho un po di difficoltà a descrivere. Facendo un copia-incolla su txt riesce ad trasferirsi, mentre se lo copio ad esempio nella barra di ricerca di ie non esce, sembra sia una specie di spazio.

ora come ora le pulizia del testo che ho portato avanti l'ha fatta con il

System.Text.RegularExpressions.Regex.Replace

ma sinceramente non saprei come procedere oltre.

Vi ringrazio dell'attenzione,
se potete darmi qualche suggerimento sono tutto orecchie!

PM Quote
Avatar
jeremy23 (Normal User)
Newbie


Messaggi: 3
Iscritto: 05/01/2014

Segnala al moderatore
Postato alle 20:13
Domenica, 05/01/2014
vi faccio l'esempio di code con un sito a caso... yahoo... così potete vedere ai "rettangoli ai quali mi riferisco"

Codice sorgente - presumibilmente VB.NET

  1. Imports System.Text.RegularExpressions
  2. Public Class Form1
  3.     Private Sub Button1_Click(ByVal sender As System.Object, _
  4.           ByVal e As System.EventArgs) Handles Button1.Click
  5.         Dim URL As String
  6.         URL = "http://yahoo.it"
  7.         Dim objScaricaURL As New ScaricaURL
  8.         objScaricaURL.SetURL(URL)
  9.         Me.TextBox1.Text = objScaricaURL.Scarica
  10.     End Sub
  11.     Private Sub Button2_Click(ByVal sender As System.Object, _
  12.           ByVal e As System.EventArgs) Handles Button2.Click
  13.         Dim URL As String
  14.         URL = "http://yahoo.it"
  15.         Dim objScaricaURL As New ScaricaURL
  16.         objScaricaURL.SetURL(URL)
  17.  
  18.  
  19.         Me.TextBox1.Text = _
  20.            System.Text.RegularExpressions.Regex.Replace( _
  21.            objScaricaURL.Scarica, "<[^>]*>", "")
  22.  
  23.  
  24. ' da qui non so come andare avanti... dovrei far sparire i "quadratini" e le catene di caratteri che non siano collocate fra un valore numerico qualsiasi e una parentesi (
  25.  
  26.  
  27.     End Sub
  28. End Class



manca la classe ma credo si capisca!


Ultima modifica effettuata da jeremy23 il 05/01/2014 alle 20:23
PM Quote