6

मैं कैस्केड क्लासिफायरफायर के आधार पर एक ऑब्जेक्ट डिटेक्टर बनाना चाहता हूं, केवल समस्या यह है कि एलबीपी और हायर विशेषताएं रोटेशन इनवेरिएंट नहीं हैं। मेरे दिमाग में आने वाली पहली बात यह है कि प्रशिक्षण कोण को विभिन्न कोणों पर घुमाएं, लेकिन मुझे संदेह है कि परिणामी वर्गीकृत की अच्छी गुणवत्ता होगी, इसके अलावा, वस्तु अनुपात बढ़ा सकती है। कई रोटेशन इनवेरिएंट डिटेक्टर हैं, उदाहरण के लिए, आईफोन किसी भी अभिविन्यास में वास्तविक समय में चेहरों को पहचानता है, इसलिए मुझे आश्चर्य है कि वे इसे कैसे प्राप्त करते हैं? मैं इसके लिए ओपनसीवी का उपयोग करना पसंद करूंगा।रोटेशन इनवेरिएंट डिटेक्टर के लिए सबसे अच्छा समाधान क्या है?

+2

आपको फीचर इनवेरिएंट डिटेक्टरों को Google करना चाहिए। कई एल्गोरिदम हैं लेकिन आपको उपयुक्त एप्लिकेशन ढूंढना होगा जो आपके एप्लिकेशन को सुइट करेगा। शायद एक अच्छा प्रारंभिक बिंदु यह दस्तावेज़ है: epubs.surrey.ac.uk/726872/1/Tuytelaars-FGV-2008.pdf – Adi

+1

कंप्यूटर-दृष्टि में सबसे अच्छा समाधान जैसी कोई चीज़ नहीं है। मामला यह है कि आईफोन कुछ फीचर एक्स को पहचानता है, यह अप्रासंगिक है, यह ज्ञात विशेषताओं वाला एक एकल उपकरण है, जिसमें संभवतः घूर्णन को आसानी से वापस करने के लिए और भी जानकारी है। इसके अलावा, आप विशेष रूप से फेस-डिटेक्शन के बारे में उल्लेख कर रहे हैं जो साबित अच्छे समाधान के साथ एक अच्छी तरह से अध्ययन किया गया विषय है। चूंकि आप चेहरे का पता लगाने की कोशिश नहीं कर रहे हैं (कुछ जवाब में आपकी टिप्पणी के अनुसार), यह भी बेहतर नहीं है क्योंकि यह एक बिल्कुल अलग विषय है। – mmgp

+1

मुझे नहीं लगता कि यह अप्रासंगिक है क्योंकि चेहरे का पता लगाने में उपयोग किए जाने वाले कुछ विचार अन्य वस्तुओं का पता लगाने के लिए उपयोग योग्य हो सकते हैं, कम से कम मुझे इसे आज़माएं। वैसे, मैं नहीं देखता कि रोटेशन "वापस" कैसे किया जा सकता है। हम एक्सेलेरोमीटर डेटा का उपयोग कर आईफोन के अभिविन्यास को निर्धारित कर सकते हैं, लेकिन चेहरे का घूर्णन अलग हो सकता है और यह अभी भी काम करता है। – lizarisk

उत्तर

1

क्या कुछ सरल समाधान के बारे में ....

Object Detection using SURF

+0

यह मेरे उद्देश्यों के लिए बहुत धीरे-धीरे और अस्थिर काम करता है (मैं एक बड़ी तस्वीर पर एक छोटे लोगो का पता लगाने की कोशिश कर रहा हूं)। – lizarisk

+0

यदि आपको लगता है कि SURF धीमा है तो आप इसके बजाय ओआरबी का उपयोग कर सकते हैं। लेकिन चमत्कार की उम्मीद न करें, आपको इसे स्थिर बनाने के लिए अपना काम करना होगा। –

+0

ओआरबी मेरे प्रयोगों में एसयूआरएफ और एसआईएफटी की तुलना में काफी खराब प्रदर्शन कर रहा था। मैं इसे और अधिक स्थिर कैसे बना सकता हूं? – lizarisk

2

फूरियर वर्णनकर्ता रोटेशन अपरिवर्तनशीलताओं (और अनुवाद के साथ ही स्केलिंग हैं अपरिवर्तनशीलताओं); तो विचार फोरियर डिस्क्रिप्टर परिणाम (जो एसईवी से जुड़े फूरियर डिस्क्रिप्टर पर पीसीए) लॉजिकल पसंद प्रतीत होता है, के साथ आपके कन्फर्मिफायर को प्रशिक्षित करना होगा।

देखें Fourier Descriptors (Wolfram)

+0

समोच्चों के साथ मुख्य समस्या मजबूती की कमी है - कुछ शोर और पृष्ठभूमि वाली छवियों पर उन्हें सही ढंग से पहचानना असंभव हो सकता है (कुछ पृष्ठभूमि अव्यवस्था ऑब्जेक्ट समोच्च में हस्तक्षेप कर सकती है, अलग-अलग रूपों में एक अयस्क एक विरूद्ध समोच्च विभाजित हो सकता है विभिन्न भागों में, आदि)। लेकिन महान वर्णनकर्ता के लिए धन्यवाद! – lizarisk

5

चेक बाहर वस्तु का पता लगाने ढांचे https://github.com/nenadmarkus/pico पर उपलब्ध है।

ढांचा आपको कस्टम ऑब्जेक्ट डिटेक्टर सीखने में सक्षम बनाता है (उदाहरण के लिए, सामने वाले, सीधे चेहरों को ढूंढने के लिए) और फिर रोटेशन इनवेरिएंट डिटेक्शन के लिए रनटाइम पर इसका उपयोग करें।

यह ऑब्जेक्ट डिटेक्टर के घूर्णन संस्करण के साथ कई अलग-अलग अभिविन्यासों पर छवि स्कैन करके हासिल किया जाता है। ध्यान दें कि इसे कैस्केड रीट्रेनिंग या इमेज रीसाम्पलिंग के बिना किया जा सकता है, और इसे आधुनिक मशीनों पर वास्तविक समय में काम करना चाहिए (प्रदत्त चेहरा पहचान डेमो करता है)।

विवरण http://arxiv.org/abs/1305.4537 पर उपलब्ध पेपर में दिए गए हैं।

 संबंधित मुद्दे

  • कोई संबंधित समस्या नहीं^_^