2009-12-15 28 views
7

Ho cercato in giro per OCR open source per il cinese. Ma senza fortuna raramente sembra che ci siano OCR open source (per il cinese) che sono utilizzabili.OCR open source per il cinese

Così sto qui a chiedermi:

  1. C'è un open source OCR per il cinese che potrebbe essere utilizzato per l'ambiente di produzione?

  2. Quali sono le principali differenze quando si implementa un OCR per le lingue latine e per il cinese? Conosco un buon OCR come Tesseract o Ocropus, cosa devo fare se voglio farlo supportare il cinese?

ogni aiuto è apprezzato e grazie in anticipo ~

risposta

4

È possibile scegliere:

  • Tesseract sostegno 3.0 cinese/giapponese supporto
  • NHOCR giapponese
+0

Tesseract 3.0 è disponibile per il download ora? Dove posso trovare la sua fonte? –

+0

Puoi consultare http://code.google.com/p/tesseract-ocr/source/checkout. –

0

cinese è di gran lunga più caratteri di lingue latine. Ci sono alcuni prodotti commerciali. Uno dei modi è contattarli e ottenere aiuto.

Non penso ci sia un open source per caratteri cinesi o giapponesi. Nell'area dell'OCR ci sono molte tecniche oltre agli algoritmi di riconoscimento dei pattern, in cui un'azienda è brava, non la comunità open source.

+0

ho trovato un po 'open source OCR per il giapponese. Sembra che non ci siano molte scelte per il cinese. Ancora grazie ~ –