तो मैं छवियों (जैसे एक नंबर 4 के रूप में) में पैटर्न पहचान करने में सक्षम होना चाहता हूँ के लिए पड़ोसी एल्गोरिथ्म, मैं अलग एल्गोरिदम के बारे में पढ़ कर दिया है और मैं वास्तव में निकटतम पड़ोसी एल्गोरिथ्म का उपयोग करना चाहेंगे यह, सरल लग रहा है और मैं इस ट्यूटोरियल के आधार पर यह समझते हैं: http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html समस्या है, हालांकि मैं समझता हूँ कि यह कैसे उपयोग करने के लिए डेटा सेट लापता में भरने के लिए, मुझे समझ नहीं आता कि कैसे मैं में उद्देश्य के लिए एक पैटर्न मान्यता उपकरण के रूप में इस्तेमाल कर सकते हैं छवि आकार पहचान। क्या कोई इस बारे में कुछ प्रकाश डाल सकता है कि यह एल्गोरिदम पैटर्न पहचान के लिए कैसे काम कर सकता है? मैंने ओपनसीवी का उपयोग करके ट्यूटोरियल देखे हैं, हालांकि मैं वास्तव में इस लाइब्रेरी का उपयोग नहीं करना चाहता क्योंकि मेरे पास प्री-प्रोसेसिंग करने की क्षमता है, और यह मूर्खतापूर्ण लगता है कि मैं इस लाइब्रेरी को केवल एक साधारण निकट पड़ोसी होना चाहिए कलन विधि।का उपयोग करना निकटतम छवि पैटर्न मान्यता
उत्तर
आप बस (बस?) को अपने डेटा के लिए "दूरी" मापने के लिए परिभाषित करना होगा।
चलें मान आप पहले से ही आप छोटे छवियों में बड़ी छवि खंडित किया है, हर एक को एक पाठ चरित्र आप वर्गीकृत करना चाहते करने के लिए इसी। आइए मान लें कि हम डिजिटल मोनोक्रोक छवियों से निपट रहे हैं, इसलिए प्रत्येक छवि को 0-255 पूर्णांक सीमा (चमक) में मान (पिक्सेल) के आयताकार मैट्रिक्स के रूप में दर्शाया जाता है। यह भी माना जाता है (एनएन एक "पर्यवेक्षित क्लैसिफिकेशन एल्गोरिदम" है) कि आपके पास पहले से ही अच्छी तरह से वर्गीकृत छवियां हैं (आपका प्रशिक्षण सेट)।
एक नई छोटी छवि को देखते हुए, आप दो छवियों ताकि प्रशिक्षण सेट में सबसे अधिक करीब चुना जाता है, और अपने "लेबल" पहचाने गए पाठ चरित्र के रूप में चुना के बीच एक दूरी परिभाषित करना होगा।
एक अनुभवहीन दृष्टिकोण (उदाहरण के लिए, वर्गों का योग) पिक्सल के अंतर लेने के लिए होगा। लेकिन यह दूरी माप अनुवाद (और घूर्णन और स्केलिंग) के प्रति संवेदनशील होगा और हम आमतौर पर इसे नहीं चाहते हैं। एक विकल्प फूरियर ट्रांसफॉर्म के मॉड्यूलस की गणना करना होगा, जो अनुवाद invariant है (लेकिन यह पर्याप्त नहीं है)। यहां से आप शुरू कर सकते हैं - और सराहना करते हैं कि समस्या मुश्किल है, और इस तरह के वर्गीकरण को स्वीकार्य प्रदर्शन करने के लिए बहुत सारे काम की ज़रूरत है।
मैं कश्मीर निकटतम पड़ोसी-कलन विधि का इस्तेमाल किया के लिए एक वास्तविक समय वीडियो कैमरा के साथ पोज-मान्यता में मान्यता पेश करती हैं। मैं आपको प्रशिक्षण और परीक्षण डेटासेट के लिए मैटलैब का उपयोग करने की सलाह दूंगा, क्योंकि इस उद्देश्य के लिए पीआरटूलबॉक्स है और इसमें बहुत सारी मदद और नमूने हैं। तेह सबसे importan बात यह है कि आप ठीक ढंग से कि मजबूती के साथ प्रत्येक वर्ग का प्रतिनिधित्व करने के लिए संभव कर देगा सुविधाओं चयन है। एक बार जब आप विशेषताएं हैं और वर्गों (इस तरह, रंग, क्षेत्र, पदों ... मानों का एक सेट हो जाएगा), आप वर्गीकारक प्रशिक्षित करने के लिए नमूने की जरूरत है (उदाहरण के लिए KNN)। वर्गीकरण के रूप में महत्वपूर्ण है कि आप प्रशिक्षण के लिए नमूने कैसे चुनते हैं। फिर आपको वर्गीकरण का परीक्षण करना होगा।
, विभिन्न प्रशिक्षण सेट, विभिन्न सुविधाओं, विभिन्न classifiers का प्रयास करें क्योंकि शायद KNN डेटा के प्रकार के लिए सबसे उपयुक्त तरीका नहीं है।
मैं आप इस उपयोगी पाते हैं उम्मीद है।
यहाँ अजगर http://shyamalapriya.github.io/digit-recognition-using-k-nearest-neighbors/
का उपयोग कर एक सरल कार्यान्वयन है