2013-02-18 14 views
5

Sono state inviate versioni di file "PDF compresso" in cui il PDF di livello superiore contiene PDF figlio.Che cos'è un "PDF compatto" e come può essere letto?

Il PDF di livello superiore funge principalmente da contenitore. L'impacchettamento non è sempre evidente nel lettore Adobe (ad esempio quando pdftk è usato per impacchettare il collegamento non viene mostrato). Riesco a trovare poco da Googling per questo termine né nel mio libro del 2012 ("Whittington", "PDF Explained", O'Reilly).

Questa è una parte standard del PDF? Se così fosse, sarei grato per i suggerimenti. E può PDFBox analizzarlo?

+0

Credo che tu stia parlando di file incorporati, non ho molta familiarità con PDFBox, ma [c'è un esempio qui] (http://pdfbox.apache.org/userguide/file_references.html9). –

+0

Grazie a @Jesse. Potresti avere ragione (il tuo riferimento avrebbe avuto un errore di battitura dovrebbe essere http://pdfbox.apache.org/userguide/file_references.html). Sarei lieto di ricevere altri commenti - sembra che il termine sia sufficientemente diffuso da causare confusione. –

+0

Qui (http://blog.didierstevens.com/2009/07/01/embedding-and-hiding-files-in-pdf-documents/ ") è un modo piuttosto subdolo di incorporare un documento in modo che Adobe abbia letto non Sembra che l'incorporamento sia piuttosto fragile o possa essere sovvertito –

risposta

2

Per quanto riguarda la tua domanda se l'utilizzo di PDF come formato di file contenitore è una parte standard del PDF:

Sì, lo è. ISO 32000-1:2008 lo descrive nella sezione 7.11.4 Stream di file incorporati.

più importanti sono i file associati a qualche pagina del documento, vedere 12.5.6.15, annotazioni file allegati, e quelli associati con il documento nel suo complesso attraverso la voce EmbeddedFiles (PDF 1.4) nel dizionario nome del documento PDF (vedere 7.7.4, Nome dizionario).

@ Il link di JesseGood a PDF File Specification sul sito PDFBox spiega come gestire questi ultimi.

Non sono molto informato su PDFBox e, quindi, non so se consente un facile accesso anche all'altro tipo di allegati. In caso contrario, sarà necessario ripetere le annotazioni di tutte le pagine per trovare le annotazioni degli allegati e gestire il contenuto in base alle specifiche PDF.

Problemi correlati