2011-01-14 15 views
12

che stavo cercando in giro per una libreria OCR - in modo ottimale sarebbe open-source - che potrei usare su alcuni file PDF arabi. Googling non ha portato a nulla di utile. Mi chiedevo se qualcuno conoscesse una libreria OCR correlata o anche una che lavori su linguaggi correlati (Farsi e Urdu potrebbero essere rilevanti) a cui potrebbe essere aggiunto il supporto arabo.Open-source libreria di OCR per l'arabo

Eventuali suggerimenti generali su come affrontare questo sarà apprezzato.

+0

http://stackoverflow.com/questions/6003630/open-source-ocr-for-arabic http://stackoverflow.com/ domande/6825712/necessità-un-opensource-di-arabo-OCR-o-in-java-o-in-dotnet –

risposta

0

Non so nulla di qualità OCR arabo, ma alcuni Googling intelligente trovato Sakhr's Automatic Reader. È un software commerciale.

Siamo spiacenti. È commerciale e piuttosto costoso. L'arabo è probabilmente una delle lingue più difficili al mondo per fare l'OCR - penso che ci vuole molto per motivare qualcuno a farlo.

7

A partire dalla versione 3.01 di Tessaract-ocr ora supporta l'arabo

0

La lingua araba è sofisticato quando si tratta di OCR a causa della natura del linguaggio e non c'è software libero o commerciale in grado di ottenere il 100% di precisione.

Questo è dalla mia esperienza personale, ma si può provare IRISREadIRIS pro 14.

+0

si prega di cercare di riformattare il post per aggiungere un po 'di grammatica, è molto difficile da leggere come. Sono partito ma ho bisogno di altro lavoro. – Vality