Non riesco a rilevare la pagina vuota nel file pdf. Ho cercato internet ma non ho trovato una buona soluzione.Come trovare la pagina vuota nel file pdf
Utilizzo di Itextsharp Ho provato con la dimensione della pagina, Xobjects. Ma non lo fanno dare il risultato esatto.
ho cercato
if(xobjects==null || textcontent==null || size <20 bytes)
then "blank"
else
not blank
Ma il tempo massimo che restituisce risposta sbagliata. Ho usato iTextSharp
Il codice è qui sotto ... Sto usando iTextSharp Librabry
Per XObjects
PdfDictionary xobjects = resourceDic.GetAsDict(PdfName.XOBJECT);
//here resourceDic is PdfDictionary type
//I know that if Xobjects is null then page is blank. But sometimes blank page gives xobjects which is not null.
Per contentstream
RandomAccessFileOrArray f = reader.SafeFile;
//here reader = new PdfReader(filename);
byte[] contentBytes = reader.GetPageContent(pageNum, f);
//I have measured the size of contentbytes but sometimes it gives more than 20 bytes for blank page
Per TextContent
String extractedText = PdfTextExtractor.GetTextFromPage(reader, pageNum, new LocationTextExtractionStrategy());
// sometimes blank page give a text more than 20 char length .
Cosa si ottiene in una pagina che si sa essere vuota? (Modifica questo dettaglio nella tua risposta, piuttosto che aggiungere dettagli sostanziali nei commenti). – halfer
@halfer vedi ora. –
Questa è una buona domanda ora. Non conosco la risposta, dal momento che non ho ancora eseguito l'analisi PDF. Hai analizzato queste tre categorie di oggetti per vedere se le pagine vuote hanno qualcosa in comune? Ad esempio, quale contenuto di testo appare effettivamente su una pagina vuota? – halfer