Ho cercato di lavorare con pdftk per ispezionare le informazioni dai flussi PDF compressi creati da Nitro Reader, ma pdftk non sgonfierà i flussi. Non produce errori, ma non sembra fare nulla oltre a riordinare gli oggetti pdf. Here è un esempio minimo di uno di questi pdf.pdftk non decomprime i flussi di dati
pdftk test.pdf output test-d.pdf uncompress
Quando provo pdftk su altri pdf, sembra funzionare correttamente. Se estraggo manualmente i flussi di dati e li decomprimo usando zlib in Python, si decomprimono correttamente. Inoltre, se apro il pdf in Adobe Reader e ri-salva, pdftk funziona bene sul pdf risultante.
Ho ispezionato manualmente il pdf Nitro al meglio delle mie possibilità e sembra essere un pdf valido. Sono molto confuso su cosa sta succedendo qui.
Come sfondo del problema, ho centinaia di questi pdf e sto cercando la ricerca di determinate parole chiave, che dovrei essere in grado di fare se posso automatizzare la decompressione.
pdftk versione 1.45
Windows 7 Home Premium SP1
Nitro Reader 2 versione 2.5.0.36
Grazie, James