Ho bisogno di estrarre gli oggetti tabella dai documenti PDF preferibilmente a livello di codice usando Perl. Sono in grado di tagliare e incollare in Excel, ma la tabella richiederebbe un bel po 'di modifica manuale una volta che i dati sono stati importati in Excel.Posso estrarre tabelle da PDF usando Perl?
Ho effettuato alcune ricerche, ma finora sembra che la maggior parte dei forum suggerisca che la maggior parte delle API sono molto primitive.
Ho appena trascorso una mezza giornata cercando di fare esattamente questo. La mia conclusione è stata che sarebbe stato più rapido copiare e incollare in Excel piuttosto che cercare di estrarre i dati da un PDF a livello di programmazione. – CanSpice
Hai guardato su CPAN? Ci sono diverse API molto apprezzate lì. Ci sono anche alcune opzioni non libere come PDFlib che possono essere utilizzate da Perl e funzionano molto bene. – Cfreak
@Cfreak, sì, ho guardato il CPAN; come detto sopra, non sembra che quei moduli possano leggere oggetti in PDF. Se mi sbaglio, mi piacerebbe che qualcuno indicasse il modulo corretto e come usarlo per leggere un tavolo. – Face