Stiamo usando iTextSharp con un'applicazione C# WinForms per analizzare un file PDF. Utilizzando iTextSharp, posso facilmente estrarre i dati di testo dal file PDF. Supponiamo che un file PDF contenga un'immagine circondata da due righe di testo. In questo caso, non sono riuscito a estrarre le informazioni sull'immagine.È possibile ottenere elementi strutturali da un file PDF utilizzando iTextSharp?
mia esigenza è:
- Diventa elementi strutturali del file PDF
- processo se ciascuno è di tipo testo, immagine, tabella o altro
Ad esempio, gli elementi strutturali sono simile al seguente:
text :paragraph1
text :paragraph2
Image:Image
text :paragraph3
Table:table info
text :Paragraph4
Se posso ottenere informazioni in un formato come questo, posso facilmente capire le informazioni su testo, immagine, tabella, intestazione o piè di pagina.
Quindi, è possibile ottenere questo tipo di informazioni utilizzando iTextSharp? Se sì, per favore illuminami su questo. Altrimenti, potresti suggerire qualche altro strumento in grado di soddisfare questo requisito?
Grazie a tutti,
Saravanan
possibile duplicato di http://stackoverflow.com/questions/5945244/extract-image-from-pdf-using-itextsharp – emd
È specifico per C# 4.0? –
@ Ryan Gates: Sì ... E 'per C# 4.0 – Saravanan