Questo sito utilizza cookies solo per scopi di autenticazione sul sito e nient'altro. Nessuna informazione personale viene tracciata. Leggi l'informativa sui cookies.
Username: Password: oppure
C/C++ - Estrarre link da un file html
Forum - C/C++ - Estrarre link da un file html

Avatar
sapiente (Normal User)
Newbie


Messaggi: 2
Iscritto: 06/05/2007

Segnala al moderatore
Postato alle 19:49
Domenica, 06/05/2007
Ciao, sto cercando una funzione o un metodo per estrarre da un file html i link presenti per poi scriverli su un altro file (.txt)

Qualcuno ha un'idea?

PM Quote
Avatar
pierotofy (Admin)
Guru^2


Messaggi: 6230
Iscritto: 04/12/2003

Segnala al moderatore
Postato alle 3:37
Lunedì, 07/05/2007
In C ANSI? Per prima cosa proverei a vedere se qualcuno ha implementato una libreria per eseguire le Regex in C, a poi applicherei il giusto pattern per estrarre i links dalla fonte html.


Il mio blog: https://piero.dev
PM Quote
Avatar
sapiente (Normal User)
Newbie


Messaggi: 2
Iscritto: 06/05/2007

Segnala al moderatore
Postato alle 20:04
Lunedì, 07/05/2007
L'unica cosa che sono riuscito a trovare è la funzione strstr per confrontare le stringhe (la mia idea è di trovare "href" in una stringa copiata dal file html e poi andare a prendere quello che sta tra le virgolette?).

Ma nessuno sa dirmi se posso fare direttamente il confronto tra una stringa e il file html?

PM Quote
Avatar
andry89mm (Member)
Pro


Messaggi: 128
Iscritto: 21/12/2006

Segnala al moderatore
Postato alle 18:01
Domenica, 20/05/2007
Ciao , sinceramente non ho idea se esista una funzione specifica al tuo caso( io ne dubito).
E sopratutto penso che alla fine la programmazione sia proprio questo: hai un problema risolvibile, risolvilo ! Risolvere quel quesito esclusivamente con le tue forze di riscatterà maggiormente.

Se posso suggerirti un possibile aiuto : vai nella sezione "sorgenti C++" cerca il programma Tag Maiuscoli ; in pratica funziona in questo modo
:
apre un file HTML,htm, o php(è indifferente)
quando trova gli angolari <> trasforma in maiuscolo il testo tra di essi, per migliorare la leggibilità del sorgente.
Potrebbe darti spunto per il tuo problema.
Buon lavoro

PM Quote