मैं स्क्रीन शॉट से कुछ अपरकेस वर्णों का पता लगाने की कोशिश कर रहा हूं। मैं यह काले और जनहित याचिका के साथ सफेद, और फिर PyTesser पेज से कोड उदाहरण का उपयोग करने के लिए कनवर्ट करते हैं, मैं छवि पर tesser.exe चलाएँ:pytesser के साथ कम सफलता दर? क्या यह शोर का मुद्दा है, या क्या ऐसा कुछ और करने की ज़रूरत है?
from pytesser import *
image = Image.open('fnord.tif')
print image_to_string(image)
मैं इस छवि का उपयोग कर रहा:
लेकिन यह इसे ई के रूप में नहीं पहचानता है, या उस मामले के लिए वास्तव में कुछ भी नहीं है। I लगता है कि यह एक पर्याप्त पर्याप्त कब्जा है? शीर्ष पर शोर इसे फेंक नहीं रहा है, है ना?
क्या मुझे कुछ याद आ रही है?
मैंने कमांड लाइन उपयोग चलाया है जो 'टेस्पेरैक्ट ओपन सोर्स ओसीआर इंजन v3.02 को लेप्टनिका के साथ दिखाता है - बिना 'psm' विकल्प के - मुझे एक खाली फ़ाइल मिलती है। माना जाता है कि '-psm 10' का उपयोग करना है, जिसे "एक चरित्र के रूप में छवि का इलाज करें" - मुझे '%' दो न्यूलाइनों के बाद मिलता है ... –
[वर्णों को सीमित करना टेसेरैक्ट दिखता है] (http://stackoverflow.com/questions/23634 9 0/सीमा-पात्र-टेस्सेक्ट-दिखने के लिए) अतीत में मेरी मदद की। – user500198
यदि आप जिस अपरकेस अक्षरों को पहचानने की कोशिश कर रहे हैं, वे एक अद्वितीय फ़ॉन्ट प्रकार में हैं जो प्रश्न में दिखाए गए स्पष्ट हैं, तो उसके लिए टेसरेक्ट पर भरोसा करने का कोई कारण नहीं है। कंकाल की जानकारी के साथ मिलकर कुछ सरल स्थलीय विशेषताएं सीधे हल कर सकती हैं। – mmgp