मैं कैस्केड क्लासिफायरफायर के आधार पर एक ऑब्जेक्ट डिटेक्टर बनाना चाहता हूं, केवल समस्या यह है कि एलबीपी और हायर विशेषताएं रोटेशन इनवेरिएंट नहीं हैं। मेरे दिमाग में आने वाली पहली बात यह है कि प्रशिक्षण कोण को विभिन्न कोणों पर घुमाएं, लेकिन मुझे संदेह है कि परिणामी वर्गीकृत की अच्छी गुणवत्ता होगी, इसके अलावा, वस्तु अनुपात बढ़ा सकती है। कई रोटेशन इनवेरिएंट डिटेक्टर हैं, उदाहरण के लिए, आईफोन किसी भी अभिविन्यास में वास्तविक समय में चेहरों को पहचानता है, इसलिए मुझे आश्चर्य है कि वे इसे कैसे प्राप्त करते हैं? मैं इसके लिए ओपनसीवी का उपयोग करना पसंद करूंगा।रोटेशन इनवेरिएंट डिटेक्टर के लिए सबसे अच्छा समाधान क्या है?
उत्तर
क्या कुछ सरल समाधान के बारे में ....
यह मेरे उद्देश्यों के लिए बहुत धीरे-धीरे और अस्थिर काम करता है (मैं एक बड़ी तस्वीर पर एक छोटे लोगो का पता लगाने की कोशिश कर रहा हूं)। – lizarisk
यदि आपको लगता है कि SURF धीमा है तो आप इसके बजाय ओआरबी का उपयोग कर सकते हैं। लेकिन चमत्कार की उम्मीद न करें, आपको इसे स्थिर बनाने के लिए अपना काम करना होगा। –
ओआरबी मेरे प्रयोगों में एसयूआरएफ और एसआईएफटी की तुलना में काफी खराब प्रदर्शन कर रहा था। मैं इसे और अधिक स्थिर कैसे बना सकता हूं? – lizarisk
लोगो मैं इस बारे में सोच से मेल खाते के लिए आप क्या जरूरत है: http://www.ijera.com/papers/Vol2_issue5/JW2517421747.pdf
फूरियर वर्णनकर्ता रोटेशन अपरिवर्तनशीलताओं (और अनुवाद के साथ ही स्केलिंग हैं अपरिवर्तनशीलताओं); तो विचार फोरियर डिस्क्रिप्टर परिणाम (जो एसईवी से जुड़े फूरियर डिस्क्रिप्टर पर पीसीए) लॉजिकल पसंद प्रतीत होता है, के साथ आपके कन्फर्मिफायर को प्रशिक्षित करना होगा।
समोच्चों के साथ मुख्य समस्या मजबूती की कमी है - कुछ शोर और पृष्ठभूमि वाली छवियों पर उन्हें सही ढंग से पहचानना असंभव हो सकता है (कुछ पृष्ठभूमि अव्यवस्था ऑब्जेक्ट समोच्च में हस्तक्षेप कर सकती है, अलग-अलग रूपों में एक अयस्क एक विरूद्ध समोच्च विभाजित हो सकता है विभिन्न भागों में, आदि)। लेकिन महान वर्णनकर्ता के लिए धन्यवाद! – lizarisk
चेक बाहर वस्तु का पता लगाने ढांचे https://github.com/nenadmarkus/pico पर उपलब्ध है।
ढांचा आपको कस्टम ऑब्जेक्ट डिटेक्टर सीखने में सक्षम बनाता है (उदाहरण के लिए, सामने वाले, सीधे चेहरों को ढूंढने के लिए) और फिर रोटेशन इनवेरिएंट डिटेक्शन के लिए रनटाइम पर इसका उपयोग करें।
यह ऑब्जेक्ट डिटेक्टर के घूर्णन संस्करण के साथ कई अलग-अलग अभिविन्यासों पर छवि स्कैन करके हासिल किया जाता है। ध्यान दें कि इसे कैस्केड रीट्रेनिंग या इमेज रीसाम्पलिंग के बिना किया जा सकता है, और इसे आधुनिक मशीनों पर वास्तविक समय में काम करना चाहिए (प्रदत्त चेहरा पहचान डेमो करता है)।
विवरण http://arxiv.org/abs/1305.4537 पर उपलब्ध पेपर में दिए गए हैं।
आपको फीचर इनवेरिएंट डिटेक्टरों को Google करना चाहिए। कई एल्गोरिदम हैं लेकिन आपको उपयुक्त एप्लिकेशन ढूंढना होगा जो आपके एप्लिकेशन को सुइट करेगा। शायद एक अच्छा प्रारंभिक बिंदु यह दस्तावेज़ है: epubs.surrey.ac.uk/726872/1/Tuytelaars-FGV-2008.pdf – Adi
कंप्यूटर-दृष्टि में सबसे अच्छा समाधान जैसी कोई चीज़ नहीं है। मामला यह है कि आईफोन कुछ फीचर एक्स को पहचानता है, यह अप्रासंगिक है, यह ज्ञात विशेषताओं वाला एक एकल उपकरण है, जिसमें संभवतः घूर्णन को आसानी से वापस करने के लिए और भी जानकारी है। इसके अलावा, आप विशेष रूप से फेस-डिटेक्शन के बारे में उल्लेख कर रहे हैं जो साबित अच्छे समाधान के साथ एक अच्छी तरह से अध्ययन किया गया विषय है। चूंकि आप चेहरे का पता लगाने की कोशिश नहीं कर रहे हैं (कुछ जवाब में आपकी टिप्पणी के अनुसार), यह भी बेहतर नहीं है क्योंकि यह एक बिल्कुल अलग विषय है। – mmgp
मुझे नहीं लगता कि यह अप्रासंगिक है क्योंकि चेहरे का पता लगाने में उपयोग किए जाने वाले कुछ विचार अन्य वस्तुओं का पता लगाने के लिए उपयोग योग्य हो सकते हैं, कम से कम मुझे इसे आज़माएं। वैसे, मैं नहीं देखता कि रोटेशन "वापस" कैसे किया जा सकता है। हम एक्सेलेरोमीटर डेटा का उपयोग कर आईफोन के अभिविन्यास को निर्धारित कर सकते हैं, लेकिन चेहरे का घूर्णन अलग हो सकता है और यह अभी भी काम करता है। – lizarisk