2012-01-16 11 views
5

Non so come cercare le lettere greche in un pdf. Come posso fare questo? Idealmente potrei farlo all'interno di un pacchetto software per visualizzatori di pdf.Ricerca di caratteri greci in un documento PDF

Dalle postazioni del forum che ho visto, le lettere greche non rientrano nei caratteri unicode standard che sono inclusi nelle specifiche pdf.

+0

perché non è possibile controllare se le lettere corrispondono a [\ u0391- \ u03A9, \ u03B1- \ u03C9]? –

+0

Quando uso il comando pdftotext da xpdf, i caratteri greci vengono visualizzati come caratteri latini. Penso che questo sia dovuto al fatto che gli output di pdftotext in utf-8 che non includono l'alfabeto greco [link] (http://superuser.com/questions/220363/cleaning-up-pdftotext-font-issues) Quale impostazione di output di pdf2text potrebbe Io uso che includerebbe caratteri greci? – Chogg

+0

Preferibilmente, tuttavia, cerco questi caratteri in un programma come pdf-XChange viewer. Posso inserire solo lettere che scrivo in una casella di ricerca, quindi non so come indicare il fatto che voglio cercare una codifica Unicode piuttosto che i caratteri che costituiscono la codifica Unicode (ad esempio \ u0391) se tu capito quello che intendo. – Chogg

risposta

2

Ho capito cosa stavo facendo male, ed era piuttosto semplice.

Posso cercare una lettera greca semplicemente utilizzando la mappa dei caratteri o passando alla tastiera dell'alfabeto greco ad esempio αβγ.

Questo in genere trova i caratteri greci. Molti PDF non riconoscono correttamente i caratteri greci e invece hanno un'approssimazione gobbledygook al personaggio con altre forme. Ciò dipende presumibilmente da come sono stati realizzati i PDF.

Problemi correlati