यह एक इष्टतम जवाब नहीं हो सकता है, लेकिन यहाँ जाता है:
मैं यकीन नहीं है कि कमांड लाइन टूल विकल्प पाठ क्षेत्रों निर्दिष्ट करने के लिए है नहीं कर रहा हूँ।
आप क्या कर सकते हैं एक अन्य प्लेटफॉर्म पर टेसेरैक्ट रैपर का उपयोग करना है (इमगुसीवी में टेस्सेरैक्ट अंतर्निहित है)। तो आपको स्कैन की गई छवि मिलती है, पाठ-क्षेत्रों को फसल मिलती है, और उन्हें एक बार में टेस्सेरक्ट को दे दिया जाता है। इस तरह आप टेसेरैक्ट के पेज-लेआउट विश्लेषण में किसी भी प्रकार की त्रुटियों से बचेंगे।
उदाहरण के लिए।
Image<Gray,Byte> scannedImage = new Image<Gray,Byte>(path_to_scanned_image);
//assuming you know a text region
Image<Gray,Byte> textRegion = new Image(100,20);
scannedImage.ROI = new Rectangle(0,0,100,20);
scannedImage.copyTo(textRegion);
ocr.recognize(textRegion);
हेहे, कि मेरे fallback योजना थी Tesseract क्षेत्रों को स्वीकार नहीं करता है, तो :) – sashoalm