Topic: Separare CSS dal contenuto della pagina  (Letto 1773 volte)

0 Utenti e 1 Visitatore stanno visualizzando questo topic.

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Separare CSS dal contenuto della pagina
« il: Gennaio 28, 2011, 22:04 »
Ciao a tutti,
cercavo un metodo semplice e veloce per separare il css dal contenuto html di una pagina web, esiste niente facile e veloce?
devo per forza ricorrere a un parser?

Grazie a tutti.

Offline Markon

  • python sapiens sapiens
  • *
  • moderatore
  • Post: 4.104
  • Punti reputazione: 5
    • Mostra profilo
    • Neolithic
Re: Separare CSS dal contenuto della pagina
« Risposta #1 il: Gennaio 28, 2011, 22:40 »
Potresti formulare la domanda in maniera più precisa?
Ricorrere a un parser per cosa?

Non ho capito, davvero.

PS:
Vuoi risalire al CSS di una pagina web tramite Python?
Non c'è il tag <link rel="..." type="text/css" href="style.css"> nella pagina html?

Ciao

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #2 il: Febbraio 03, 2011, 20:53 »
Scusami, sono desolato, non ho più risposto  :quiet:

Spiego bene il mio problema,
volevo parsare una pagina web in modo tale da ottenere solo il testo contenuto in quella pagina, e volevo farlo nel modo più veloce (in tutti i sensi che si possa intendere) e pulito possibile.

Ad esempio da questa, volevo ottenere solo questo:
Citazione
Smush.it: Comprimere le immagini online senza perdere qualità

Smush.it è un’applicazione online molto comoda che ci consente di comprimere le noste immagini senza perdere qualità. La compressione delle immagini è un fattore molto importante che ci consente di ridurre notevolmente il tempo di caricamento di un sito web, soprattutto se le si usano spesso (come in un blog).


Smush.it è sviluppato da Yahoo! ed è disponibile sia come applicazione online al sito ufficiale, sia come plugin per WordPress. Sicuramente rappresenta uno dei pligin per WordPress indispensabili da avere per migliorare le performance del sito.
(non  ci sono gli spoiler?)
O al massimo il testo con giusto l'html per la formattazione.

Grazie

Offline Python

  • python sapiens sapiens
  • ******
  • Post: 2.045
  • Punti reputazione: 2
  • Radon - Cyclomatic Complexity of your Python code
    • Mostra profilo
    • Radon - Cyclomatic Complexity of your Python code
Re: Separare CSS dal contenuto della pagina
« Risposta #3 il: Febbraio 09, 2011, 17:34 »
Con BeautifulSoup dovresti cavartela facilmente. Credo che basti un soup.findAll('p') o qualcosa del genere...

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #4 il: Febbraio 10, 2011, 16:41 »
si, ok ma non tutte le pagine usano il tag 'p' per il testo, c'è chi usa una classe:
[codice]<div class='post-body entry-content'> [/codice]
(blogspot)
c'è chi mette tutto dentro:
[codice]<div class="content"> [/codice]
e poi il testo dentro il tag 'p'.
(il post)

Insomma non è così uniforme....

Offline Markon

  • python sapiens sapiens
  • *
  • moderatore
  • Post: 4.104
  • Punti reputazione: 5
    • Mostra profilo
    • Neolithic
Re: Separare CSS dal contenuto della pagina
« Risposta #5 il: Febbraio 10, 2011, 17:08 »
I problemi sono diventati 2 :)
Dal parsing di una pagina HTML al parsing di svariate pagine HTML.

La soluzione che ti ha dato l'utente Python era giusta.
Se ci dici cos'hai intenzione di fare magari ti aiutiamo meglio ;)

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #6 il: Febbraio 10, 2011, 19:21 »
ok, chiarisco il tutto.

volevo creare un piccolo programmino per memorizzare vari articoli che si possono trovare online, dato che i siti che mi interessano sono più o meno gli stessi, l'idea di base è quindi memorizzare il css e il contenuto in due file diversi e poi mischiarli a piacimento e visualizzarli su browser offline.

Ora dato che comunque non stiamo parlando di tantissimi kbite potrei ogni volta memorizzarmi direttamente la pagina web, anche se non mi piace come metodo, quindi se trovavo un sistema veloce per dividere css e contenuto e magari anche rimischiarli insieme mi risparmiavo un sacco di tempo.

Ecco tutto, idee? :question:

Offline nkint

  • python neanderthalensis
  • ****
  • Post: 368
  • Punti reputazione: 1
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #7 il: Febbraio 10, 2011, 20:23 »
del parsing html non penso tu possa evitarlo..

e a meno di trovare dei trick "appearence based" chessò prendere tutti i blocchi di testo dentro i tag <p> (sto sparando a caso eh) che siano lunghi almeno più di 100 parole o cose simili non credo sia facile uniformare ciò che non è uniforme.. ma è un problema concettuale più che altro

per me ti conviene creare dei template per i tuoi vari siti e quindi chessò avrai la procedura per blogspot, quella per wordpress, etc..

Offline Markon

  • python sapiens sapiens
  • *
  • moderatore
  • Post: 4.104
  • Punti reputazione: 5
    • Mostra profilo
    • Neolithic
Re: Separare CSS dal contenuto della pagina
« Risposta #8 il: Febbraio 10, 2011, 20:36 »
Ma non puoi usare i feed?

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #9 il: Febbraio 11, 2011, 16:03 »
per me ti conviene creare dei template per i tuoi vari siti e quindi chessò avrai la procedura per blogspot, quella per wordpress, etc..

Ci pensavo anch'io, ma non mi convince un granchè....

Ma non puoi usare i feed?
Ni non tutti i siti hanno i feed, e poi dovrei cercare tra tutti i feed di un sito solo i feed che interessano a me...e non so da dove iniziare...
« Ultima modifica: Febbraio 11, 2011, 16:07 da Bob »

Offline Python

  • python sapiens sapiens
  • ******
  • Post: 2.045
  • Punti reputazione: 2
  • Radon - Cyclomatic Complexity of your Python code
    • Mostra profilo
    • Radon - Cyclomatic Complexity of your Python code
Re: Separare CSS dal contenuto della pagina
« Risposta #10 il: Febbraio 11, 2011, 16:19 »
Beh se poi decidi di usare i feed, c'è sempre feedparser che ti può semplificare la vita.

Offline Bob

  • python erectus
  • ***
  • Post: 140
  • Punti reputazione: 0
    • Mostra profilo
Re: Separare CSS dal contenuto della pagina
« Risposta #11 il: Febbraio 12, 2011, 13:52 »
la strada dei feed effettivamente è più veloce, ma non ho idea di come dato l'url giungere al feed.....