Programmazione Python > Altre tematiche

scrape pagine

(1/1)

carlo123:
Ciao Sto usando soap per fare lo scraping di alcune pagine.
Ho un dubbio...dopo aver fatto il parser inizio a cercare quello che mi voglio prendere. Ad esempio per questa riga:
         <div class="row">
            <div class="col-xs-6 col-sm-4 col-md-5 col-lg-4 anagrafica-dato">Nr Magazzino</div>
            <div class="col-xs-6 col-md-7 col-sm-8 col-lg-8 anagrafica-risultato">180/2016</div>
         </div>

faccio una ricerca in questo modo:

                        NrMagazzino= internopagina.find_all('div', {'class': 'col-xs-6 col-md-7 col-sm-8 col-lg-8 anagrafica-risultato'})[
                            1].text
e mi prendo il valore 180/2016

Praticamente mi trovo quella classe e mi prendo il valore all'interno.

Il mio dubbio è che dietro un codice del genere devo stare sempre attento al fatto che cambi qualcosa dentro quella classe, invece, volevo sapere se fosse possibile cercare ad esempèio il nome della label, quindi in questo caso NR Magazzino e poi prendere il valore del Tag successivo. In questo modo, se cambia grafica e classe so comunque che il nome della label rimane quello.

grazie
Carlo

Navigazione

[0] Indice dei post

Vai alla versione completa