Una volta acquisito il codice html di una paggina dovrei fare una "semplice" cosa:
Mi serve solo "il testo" che compare sulla schermata della pagina senza tutti gli altri campi che si trovano nel html. ES:
Pagina html:
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<title>New Page 1</title>
</head>
<div class="menulink" style="width: 142px; font-family: Arial; margin-top: 0px; margin-bottom: 0px; margin-left: 4px; padding-left: 0px; text-align: left; background-color: #3a83a0;">
<div style="padding-left:10px; padding-top: 2px; padding-bottom:2px; padding-right: 6px; font-size: 12px; color: #FFFFFF; "><div align='left'>Utenti online: 10<br>
Membri: 0<br>
Loggati: 1<br>
Anonimi: 9<br>
</div></div></div>
<div style="margin-left: 4px; margin-top: 0px; margin-right: 0px; margin-bottom: 0px; background-image: url(http://www.pierotofy.it/data/images/menu_bottom.gif);\ background-repeat: no-repeat; width: 142px; height: 6px;">
</div>
</html>
Se la mettete in un file e poi la aprite escono queste scritte:
Utenti online: 10
Membri: 0
Loggati: 1
Anonimi: 9
A me servirebbero solo gli ultimi 4 righi qui sopra.. Praticamente un piccolo programma che mi estragga quello che "appare" sullo schermo...--
Tuttavia dato che le pagine sono molto e diverse fra loro. Non saprei come fare... Ho pensoto di usare le regex ma nn so da dove partire..
Confido in un vostro aiuto grazie...
Ultima modifica effettuata da antoniol il 14/04/2007 alle 22:07 |