सबसे अच्छा सेट जैसा कुछ भी नहीं है। ध्यान रखें कि डिजिटल छवियों को विभिन्न कैप्चर डिवाइसों द्वारा अधिग्रहित किया जा सकता है और प्रत्येक डिवाइस अपनी प्रीप्रोकैसिंग सिस्टम (फ़िल्टर) और अन्य विशेषताओं को एम्बेड कर सकता है जो छवि को भारी रूप से बदल सकते हैं और यहां तक कि शोर भी जोड़ सकते हैं। तो हर मामले को अलग-अलग इलाज किया जाना चाहिए (preprocessed) अलग-अलग।
हालांकि, वहाँ commmon संचालन कि उदाहरण के लिए खोज को सुधारने में इस्तेमाल किया जा सकता है, एक बहुत ही बुनियादी एक स्केल और छवि binarize करने के लिए एक threshold लागू करने के लिए छवि परिवर्तित करने के लिए किया जाएगा। एक और तकनीक जिसका मैंने पहले उपयोग किया है the bounding box है, जो आपको टेक्स्ट क्षेत्र का पता लगाने की अनुमति देता है। छवियों से शोर को हटाने के लिए आपको ईरोड/फैलाने के संचालन में रुचि हो सकती है। मैं इन परिचालनों में से कुछ को this post पर प्रदर्शित करता हूं।
अब, बस आप एक सरल दृष्टिकोण है कि कर सकते हैं दिखाने के लिए:
इसके अलावा, वहाँ ओसीआर और OpenCV के बारे में अन्य रोचक पोस्ट है कि आप एक बार देख लेना चाहिए अपनी नमूना छवि के साथ प्रयोग किया जाए, यह रंग बदलने और थ्रेसहोल्ड लगाने का नतीजा है:

cv::Mat new_img = cv::imread(argv[1]);
cv::bitwise_not(new_img, new_img);
double thres = 100;
double color = 255;
cv::threshold(new_img, new_img, thres, color, CV_THRESH_BINARY);
cv::imwrite("inv_thres.png", new_img);
क्या आप यहां उन नमूना छवियों को अपलोड कर सकते हैं? लिंक 403 वर्जित – Alupotha