pytesser के साथ कम सफलता दर? क्या यह शोर का मुद्दा है, या क्या ऐसा कुछ और करने की ज़रूरत है?

मैं स्क्रीन शॉट से कुछ अपरकेस वर्णों का पता लगाने की कोशिश कर रहा हूं। मैं यह काले और जनहित याचिका के साथ सफेद, और फिर PyTesser पेज से कोड उदाहरण का उपयोग करने के लिए कनवर्ट करते हैं, मैं छवि पर tesser.exe चलाएँ:pytesser के साथ कम सफलता दर? क्या यह शोर का मुद्दा है, या क्या ऐसा कुछ और करने की ज़रूरत है?

from pytesser import * 
image = Image.open('fnord.tif') 
print image_to_string(image)

मैं इस छवि का उपयोग कर रहा:

लेकिन यह इसे ई के रूप में नहीं पहचानता है, या उस मामले के लिए वास्तव में कुछ भी नहीं है। I लगता है कि यह एक पर्याप्त पर्याप्त कब्जा है? शीर्ष पर शोर इसे फेंक नहीं रहा है, है ना?

क्या मुझे कुछ याद आ रही है?

स्रोत

2012-08-12 Zack

मैंने कमांड लाइन उपयोग चलाया है जो 'टेस्पेरैक्ट ओपन सोर्स ओसीआर इंजन v3.02 को लेप्टनिका के साथ दिखाता है - बिना 'psm' विकल्प के - मुझे एक खाली फ़ाइल मिलती है। माना जाता है कि '-psm 10' का उपयोग करना है, जिसे "एक चरित्र के रूप में छवि का इलाज करें" - मुझे '%' दो न्यूलाइनों के बाद मिलता है ... –

[वर्णों को सीमित करना टेसेरैक्ट दिखता है] (http://stackoverflow.com/questions/23634 9 0/सीमा-पात्र-टेस्सेक्ट-दिखने के लिए) अतीत में मेरी मदद की। – user500198

यदि आप जिस अपरकेस अक्षरों को पहचानने की कोशिश कर रहे हैं, वे एक अद्वितीय फ़ॉन्ट प्रकार में हैं जो प्रश्न में दिखाए गए स्पष्ट हैं, तो उसके लिए टेसरेक्ट पर भरोसा करने का कोई कारण नहीं है। कंकाल की जानकारी के साथ मिलकर कुछ सरल स्थलीय विशेषताएं सीधे हल कर सकती हैं। – mmgp

यदि आप इस बारे में चिंतित हैं कि शोर एक मुद्दा है तो मैन्युअल रूप से छवि को एमएसपीएंड या कुछ इसी तरह खोलें, शोर को हटा दें और फिर नई छवि को ओसीआर के माध्यम से चलाएं। यह जानने का सबसे अच्छा तरीका है कि ओसीआर इंजन कैसे काम करता है और इससे क्या भ्रमित होता है और क्या नहीं। प्रत्येक ओसीआर इंजन अलग-अलग काम करता है।

इस मामले में यह शोर के छोटे बिट्स चरित्र जोनिंग प्रक्रिया को भ्रमित कर रहे हैं। आपको ओसीआर इंजन से लौटाए गए बाउंडिंग बॉक्स मानों को देखना चाहिए ताकि यह देखने के लिए कि ओसीआर इंजन आपके शब्द या चरित्र के लिए सही स्थान पर भी देख रहा है या नहीं।

कुछ ओसीआर इंजनों में ओसीआर प्रक्रिया के दौरान छवि से शोर को हटाने के विकल्प होते हैं। इसे अक्सर डिस्प्लेकल या शोर हटाने कहा जाता है। लेपोनिका (http://www.leptonica.org) का उपयोग करके शोर को हटाना संभव होगा जो अब नवीनतम टेसेरैक्ट छवियों का हिस्सा है।

स्क्रीन फोंट ओसीआर इंजनों को एक बड़ी चुनौती पेश करते हैं क्योंकि डीपीआई अक्सर बहुत कम होता है। आपके 'ई' के मामले में पर्याप्त पिक्सेल पहचाने जाने चाहिए। भारी स्ट्रोक वजन इंजन को भ्रमित कर सकता है।

इसके अलावा वाणिज्यिक इंजन आमतौर पर टेस्सेक्ट से अधिक सटीक होंगे लेकिन महंगे लाइसेंस शुल्क के साथ भी आएंगे।

स्रोत

2012-09-19 08:27:35

pytesser के साथ कम सफलता दर? क्या यह शोर का मुद्दा है, या क्या ऐसा कुछ और करने की ज़रूरत है?

उत्तर

संबंधित मुद्दे