में छवि वर्गीकरण मैं स्कैन किए गए पृष्ठों को वर्गीकृत करने की एक विधि की तलाश में हूं जिसमें बड़े पैमाने पर पाठ शामिल है।पायथन
यहां मेरी समस्या का विवरण दिया गया है। मेरे पास स्कैन किए गए दस्तावेज़ों का एक बड़ा संग्रह है और इन दस्तावेज़ों के भीतर कुछ प्रकार के पृष्ठों की उपस्थिति का पता लगाने की आवश्यकता है। मैं दस्तावेज़ों को उनके घटक पृष्ठों में "फट" करने की योजना बना रहा हूं (जिनमें से प्रत्येक एक व्यक्तिगत छवि है) और इन छवियों में से प्रत्येक को "ए" या "बी" के रूप में वर्गीकृत करें। लेकिन मैं ऐसा करने का सबसे अच्छा तरीका नहीं समझ सकता।
अधिक विवरण:
- मैं 'ए' और 'बी' छवियों (पृष्ठों) के कई उदाहरण हैं, इसलिए मैं देखरेख सीखने कर सकते हैं।
- यह मुझे अस्पष्ट है कि प्रशिक्षण के लिए इन छवियों से सुविधाओं को सर्वोत्तम तरीके से निकालने के लिए कैसे करें। जैसे वो विशेषताएं क्या हैं?
- पृष्ठों को कभी-कभी थोड़ा घुमाया जाता है, इसलिए वर्गीकरण कुछ घूर्णन और (कुछ हद तक) स्केलिंग के लिए असंवेदनशील था।
- मुझे एक शुद्ध-प्लेटफ़ॉर्म समाधान चाहिए, आदर्श रूप से शुद्ध पायथन में या सामान्य पुस्तकालयों का उपयोग करना।
- मैंने ओपनसीवी का उपयोग करने के बारे में सोचा है, लेकिन यह एक "भारी वजन" समाधान की तरह लगता है।
संपादित करें:
- 'ए' और 'बी' के पन्नों में मतभेद है कि 'बी' पेज एक ही सामान्य संरचना के साथ उन पर रूपों, एक बार कोड की उपस्थिति सहित है। "ए" पृष्ठ मुफ्त टेक्स्ट हैं।
वे अलग-अलग कैसे होते हैं? फ़ॉन्ट? आकार? क्या आप केवल ओसीआर के कुछ हिस्से (शीर्षक में एक शीर्षक या लेखक?) –
निक, मैंने उस पर स्पष्टीकरण देने के लिए एक संपादन जोड़ा। दरअसल, मेरा लक्ष्य बी * पृष्ठों के बाद * सब कुछ फेंकना है क्योंकि मुझे उन्हें ओसीआर नहीं करना है। तो, मुझे किसी ओसीआर करने से पहले उन्हें वास्तव में पहचानने की ज़रूरत है। – Kyle
यह एक कठिन समस्या है - जब तक कि आपका संग्रह वास्तव में जबरदस्त न हो, क्या पृष्ठों को मैन्युअल रूप से 'ए' या' बी 'के रूप में वर्गीकृत करना आसान नहीं होगा? आप बदले में उन्हें प्रदर्शित करने के लिए थोड़ा जीयूआई ऐप लिख सकते हैं ताकि आप प्रति पृष्ठ एक कुंजी दबा सकें। – katrielalex