Questo sito utilizza cookies, anche di terze parti, per mostrare pubblicità e servizi in linea con il tuo account. Leggi l'informativa sui cookies.
Username: Password: oppure
C# / VB.NET - [VB.NET]creazione di una sitemap
Forum - C# / VB.NET - [VB.NET]creazione di una sitemap

Avatar
ernano530 (Normal User)
Newbie


Messaggi: 4
Iscritto: 10/02/2011

Segnala al moderatore
Postato alle 9:55
Lunedì, 05/09/2011
Buongiorno, come da titolo vorrei creare un piccolo generatore di sitemap, ma non so come sfruttare il controllo webbrowser per prelevare tutti i link di un sito web, avete suggerimenti? Grazie.

aggiornamento
-------------------------------------------------------------------
attualmente sto utilizzando ovviamente il controllo webbrowser, poi all'evento DocumentCompleted uso il metodo GetElementsByTagName("a") per prelevare tutti i link dalla pagina, quindi posso scrivere i link che appartengono allo stesso host nella sitemap, ora il problema è come incominciare a scandagliare tutte le altre pagine, quindi interrogare tutti i link ('dello stesso host ovviamente') trovati precedentemente Suggerimenti? scusa se forse mi sono espresso male...

Ultima modifica effettuata da ernano530 il 05/09/2011 alle 16:05
PM
Avatar
Qwertj (Dev Team)
Guru


Messaggi: 678
Iscritto: 30/05/2011

Up
0
Down
V
Segnala al moderatore
Postato alle 11:09
Lunedì, 05/09/2011
Per creare una sitemap dovresti accedere tramite FTP al sito, listare tutti i file e le cartelle ricorsivamente, mostrarle in un TreeView, far scegliere all'utente quali pagine e cartelle inserire nella sitemap, generare il file xml con le classi del namespace System.Xml

Nel caso, anzi nella stramaggioranza dei casi non avrebbe senso, perchè se è un cms da ftp non puoi trovarti le pagine, poi non si ha sempre la possibilità di un accesso ftp - ernano530 - 05/09/11 15:58
Allora devi farti un micro spider che partendo da una pagina cerchi tutti i link interni del sito, li memorizzi e cominci a visitarli finchè non li ha visitati tutti. Il programma è quasi più semplice, ma ci mette di più - Qwertj - 05/09/11 18:06
Mi dai un suggerimento su come posso implementare questo spider? Dopo che partendo dalla home di un sito mi ricavo tutti link,con che modalità credi dovrei procedere a scandagliare tutti i link che ho ricavato - ernano530 - 06/09/11 01:07
Ogni volta che trovi un link lo inserisci in una lista, controllando che non ci sia già. Poi quando hai ottenuto tutti i link della pagina, navighi all'indirizzo del primo link della lista, e continui così (ricordandoti di levare i link che visiti dalla lista) - Qwertj - 06/09/11 10:09


Blog:
<coming soon>
Appalo:
http://www.appalo.it/
PM