Topic: Conversione di un estratto conto bancario da formato pdf ad excel  (Letto 116 volte)

0 Utenti e 1 Visitatore stanno visualizzando questo topic.

Offline Federico De Marco

  • python unicellularis
  • *
  • Post: 3
  • Punti reputazione: 0
    • Mostra profilo
Ho necessità di creare file excel estraendo dati da un estratto conto bancario in pdf. Il software dovrà individuare l'area di interesse all'interno dell'estratto conto e portare i dati in un file excel composto dei seguenti campi: data contabile, data valuta, data disponibile (quando presente), movimenti dare (o uscite o addebiti), movimenti avere (o entrate o accrediti), descrizione movimenti.
Ogni movimento creerà un'unica riga del database (quindi, ad esempio se la descrizione movimento occupa più righe dovrà essere troncata o trasferita su un'unica riga). Ogni estratto conto produrrà un unico database (unica tabella di access, unico foglio di excel), tutte le altre informazioni presenti sul file pdf non saranno trasferite sul file excel/access. Poichè ogni banca ha il suo format, l'utente dovrà essere autonomo nell'adattare l'estrazione dei dati al format della banca.

Secondo voi è possibile realizzare tutto ciò con python?

Offline bebo

  • python erectus
  • ***
  • Post: 238
  • Punti reputazione: 0
    • Mostra profilo
    • bebo_sudo's personal homepage
Re: Conversione di un estratto conto bancario da formato pdf ad excel
« Risposta #1 il: Maggio 22, 2019, 15:43 »
Possibile, certo. Sarebbe un software solido? Dubito: se cambieranno il template del pdf cosa succede?

La parte che piu' mi preoccupa e' questa:
Citazione
Poichè ogni banca ha il suo format, l'utente dovrà essere autonomo nell'adattare l'estrazione dei dati al format della banca.

Non sono sviluppatore nel settore bancario, ma sei sicuro non ci siano degli standard di intercomunicazione tra banche, o delle "API" da poter chiamare?
Farei una prima analisi dello stato delle cose prima di buttarsi a scrivere codice

Offline Federico De Marco

  • python unicellularis
  • *
  • Post: 3
  • Punti reputazione: 0
    • Mostra profilo
Re: Conversione di un estratto conto bancario da formato pdf ad excel
« Risposta #2 il: Maggio 22, 2019, 17:11 »
Possibile, certo. Sarebbe un software solido? Dubito: se cambieranno il template del pdf cosa succede?

La parte che piu' mi preoccupa e' questa:
Citazione
Poichè ogni banca ha il suo format, l'utente dovrà essere autonomo nell'adattare l'estrazione dei dati al format della banca.

Non sono sviluppatore nel settore bancario, ma sei sicuro non ci siano degli standard di intercomunicazione tra banche, o delle "API" da poter chiamare?
Farei una prima analisi dello stato delle cose prima di buttarsi a scrivere codice

Non tutte forniscono delle API. Quindi per adesso l'unica soluzione rimane quella descritta precedentemente.
Quanto richiesto richiederebbe eccessivi sforzi di programmazione? Tralasciando la solidità del software, che potrebbe essere superata attraverso la possibilità di alcuni manual adjustments

Offline bebo

  • python erectus
  • ***
  • Post: 238
  • Punti reputazione: 0
    • Mostra profilo
    • bebo_sudo's personal homepage
Re: Conversione di un estratto conto bancario da formato pdf ad excel
« Risposta #3 il: Maggio 22, 2019, 17:45 »
Non ho mai dovuto estrarre dati da pdf; ho dato un'occhiata e ci sono un po' di strumenti:
https://stackoverflow.com/questions/34517511/pdf-data-extraction-with-python-3-4
https://stackoverflow.com/questions/34837707/how-to-extract-text-from-a-pdf-file

Bisognerebbe provare prendendo tutti i pdf delle banche che ti interessano e fare tanti tanti test iniziali prima di buttarsi a sviluppare un estrattore pulito (ad es. mi viene in mente al volo: cosa succede se un estratto conto finisce su piu' pagine? etc)

Sulle tempistiche non posso aiutarti.

Offline nuzzopippo

  • python habilis
  • **
  • Post: 60
  • Punti reputazione: 0
    • Mostra profilo
Re: Conversione di un estratto conto bancario da formato pdf ad excel
« Risposta #4 il: Maggio 24, 2019, 11:54 »
Ciao,

Interessato da alcuni aspetti del discorso ho fatto un po' di ricerche, tra le tante ho trovato questa pagina su html.it che mi sembra interessante (non ho ancora effettuato nessun test in merito), la segnalo

[Edit] Fatto un test preliminare in un virtualenv per python 2.7, su sistema ubuntu 18.04, installando da pip camelot-py e opencv-python, una tabella dati contenuta in un pdf creato con libreoffice viene letta ed esportata correttamente in formato csv, per excell credo occorrerebbero le librerie pandas, mi da errore e penso sia quello in motivo
« Ultima modifica: Maggio 24, 2019, 13:18 da nuzzopippo »

Offline Federico De Marco

  • python unicellularis
  • *
  • Post: 3
  • Punti reputazione: 0
    • Mostra profilo
Re: Conversione di un estratto conto bancario da formato pdf ad excel
« Risposta #5 il: Maggio 28, 2019, 11:20 »
ho provato ad utilizzare le risorse da te suggerite, ma non sono riuscito ad ottenere i risultati sperati.  :(