2012-08-12 13 views
6

मैं स्क्रीन शॉट से कुछ अपरकेस वर्णों का पता लगाने की कोशिश कर रहा हूं। मैं यह काले और जनहित याचिका के साथ सफेद, और फिर PyTesser पेज से कोड उदाहरण का उपयोग करने के लिए कनवर्ट करते हैं, मैं छवि पर tesser.exe चलाएँ:pytesser के साथ कम सफलता दर? क्या यह शोर का मुद्दा है, या क्या ऐसा कुछ और करने की ज़रूरत है?

from pytesser import * 
image = Image.open('fnord.tif') 
print image_to_string(image)  

मैं इस छवि का उपयोग कर रहा: http://i.imgur.com/so419.png

लेकिन यह इसे ई के रूप में नहीं पहचानता है, या उस मामले के लिए वास्तव में कुछ भी नहीं है। I लगता है कि यह एक पर्याप्त पर्याप्त कब्जा है? शीर्ष पर शोर इसे फेंक नहीं रहा है, है ना?

क्या मुझे कुछ याद आ रही है?

+2

मैंने कमांड लाइन उपयोग चलाया है जो 'टेस्पेरैक्ट ओपन सोर्स ओसीआर इंजन v3.02 को लेप्टनिका के साथ दिखाता है - बिना 'psm' विकल्प के - मुझे एक खाली फ़ाइल मिलती है। माना जाता है कि '-psm 10' का उपयोग करना है, जिसे "एक चरित्र के रूप में छवि का इलाज करें" - मुझे '%' दो न्यूलाइनों के बाद मिलता है ... –

+0

[वर्णों को सीमित करना टेसेरैक्ट दिखता है] (http://stackoverflow.com/questions/23634 9 0/सीमा-पात्र-टेस्सेक्ट-दिखने के लिए) अतीत में मेरी मदद की। – user500198

+0

यदि आप जिस अपरकेस अक्षरों को पहचानने की कोशिश कर रहे हैं, वे एक अद्वितीय फ़ॉन्ट प्रकार में हैं जो प्रश्न में दिखाए गए स्पष्ट हैं, तो उसके लिए टेसरेक्ट पर भरोसा करने का कोई कारण नहीं है। कंकाल की जानकारी के साथ मिलकर कुछ सरल स्थलीय विशेषताएं सीधे हल कर सकती हैं। – mmgp

उत्तर

1

यदि आप इस बारे में चिंतित हैं कि शोर एक मुद्दा है तो मैन्युअल रूप से छवि को एमएसपीएंड या कुछ इसी तरह खोलें, शोर को हटा दें और फिर नई छवि को ओसीआर के माध्यम से चलाएं। यह जानने का सबसे अच्छा तरीका है कि ओसीआर इंजन कैसे काम करता है और इससे क्या भ्रमित होता है और क्या नहीं। प्रत्येक ओसीआर इंजन अलग-अलग काम करता है।

इस मामले में यह शोर के छोटे बिट्स चरित्र जोनिंग प्रक्रिया को भ्रमित कर रहे हैं। आपको ओसीआर इंजन से लौटाए गए बाउंडिंग बॉक्स मानों को देखना चाहिए ताकि यह देखने के लिए कि ओसीआर इंजन आपके शब्द या चरित्र के लिए सही स्थान पर भी देख रहा है या नहीं।

कुछ ओसीआर इंजनों में ओसीआर प्रक्रिया के दौरान छवि से शोर को हटाने के विकल्प होते हैं। इसे अक्सर डिस्प्लेकल या शोर हटाने कहा जाता है। लेपोनिका (http://www.leptonica.org) का उपयोग करके शोर को हटाना संभव होगा जो अब नवीनतम टेसेरैक्ट छवियों का हिस्सा है।

स्क्रीन फोंट ओसीआर इंजनों को एक बड़ी चुनौती पेश करते हैं क्योंकि डीपीआई अक्सर बहुत कम होता है। आपके 'ई' के मामले में पर्याप्त पिक्सेल पहचाने जाने चाहिए। भारी स्ट्रोक वजन इंजन को भ्रमित कर सकता है।

इसके अलावा वाणिज्यिक इंजन आमतौर पर टेस्सेक्ट से अधिक सटीक होंगे लेकिन महंगे लाइसेंस शुल्क के साथ भी आएंगे।