È possibile utilizzare Docotic.Pdf library per la ricerca di testo in file PDF.
seguente esempio mostra come trovare stringhe specificate in un file PDF e numeri di pagina corrispondenti:
static void searchForTextStrings()
{
string path = "";
string[] stringsToFind = new string[] { };
using (PdfDocument pdf = new PdfDocument(path))
{
for (int i = 0; i < pdf.Pages.Count; i++)
{
string pageText = pdf.Pages[i].GetText();
foreach (string s in stringsToFind)
{
int index = pageText.IndexOf(s, 0, StringComparison.CurrentCultureIgnoreCase);
if (index != -1)
Console.WriteLine("'{0}' found on page {1}", s, i);
}
}
}
}
Una ricerca tra maiuscole e minuscole può essere realizzato se si rimuove terzo argomento metodo IndexOf.
Disclaimer: Lavoro per Bit Miracle, venditore della biblioteca.
Grazie per il codice! Questo esempio richiede tuttavia un'installazione di Adobe Professional. Per motivi relativi alle licenze mi piacerebbe avere un componente per farlo. – splattne