रोटेशन इनवेरिएंट डिटेक्टर के लिए सबसे अच्छा समाधान क्या है?

मैं कैस्केड क्लासिफायरफायर के आधार पर एक ऑब्जेक्ट डिटेक्टर बनाना चाहता हूं, केवल समस्या यह है कि एलबीपी और हायर विशेषताएं रोटेशन इनवेरिएंट नहीं हैं। मेरे दिमाग में आने वाली पहली बात यह है कि प्रशिक्षण कोण को विभिन्न कोणों पर घुमाएं, लेकिन मुझे संदेह है कि परिणामी वर्गीकृत की अच्छी गुणवत्ता होगी, इसके अलावा, वस्तु अनुपात बढ़ा सकती है। कई रोटेशन इनवेरिएंट डिटेक्टर हैं, उदाहरण के लिए, आईफोन किसी भी अभिविन्यास में वास्तविक समय में चेहरों को पहचानता है, इसलिए मुझे आश्चर्य है कि वे इसे कैसे प्राप्त करते हैं? मैं इसके लिए ओपनसीवी का उपयोग करना पसंद करूंगा।रोटेशन इनवेरिएंट डिटेक्टर के लिए सबसे अच्छा समाधान क्या है?

स्रोत

2013-02-14 lizarisk

आपको फीचर इनवेरिएंट डिटेक्टरों को Google करना चाहिए। कई एल्गोरिदम हैं लेकिन आपको उपयुक्त एप्लिकेशन ढूंढना होगा जो आपके एप्लिकेशन को सुइट करेगा। शायद एक अच्छा प्रारंभिक बिंदु यह दस्तावेज़ है: epubs.surrey.ac.uk/726872/1/Tuytelaars-FGV-2008.pdf – Adi

कंप्यूटर-दृष्टि में सबसे अच्छा समाधान जैसी कोई चीज़ नहीं है। मामला यह है कि आईफोन कुछ फीचर एक्स को पहचानता है, यह अप्रासंगिक है, यह ज्ञात विशेषताओं वाला एक एकल उपकरण है, जिसमें संभवतः घूर्णन को आसानी से वापस करने के लिए और भी जानकारी है। इसके अलावा, आप विशेष रूप से फेस-डिटेक्शन के बारे में उल्लेख कर रहे हैं जो साबित अच्छे समाधान के साथ एक अच्छी तरह से अध्ययन किया गया विषय है। चूंकि आप चेहरे का पता लगाने की कोशिश नहीं कर रहे हैं (कुछ जवाब में आपकी टिप्पणी के अनुसार), यह भी बेहतर नहीं है क्योंकि यह एक बिल्कुल अलग विषय है। – mmgp

मुझे नहीं लगता कि यह अप्रासंगिक है क्योंकि चेहरे का पता लगाने में उपयोग किए जाने वाले कुछ विचार अन्य वस्तुओं का पता लगाने के लिए उपयोग योग्य हो सकते हैं, कम से कम मुझे इसे आज़माएं। वैसे, मैं नहीं देखता कि रोटेशन "वापस" कैसे किया जा सकता है। हम एक्सेलेरोमीटर डेटा का उपयोग कर आईफोन के अभिविन्यास को निर्धारित कर सकते हैं, लेकिन चेहरे का घूर्णन अलग हो सकता है और यह अभी भी काम करता है। – lizarisk

क्या कुछ सरल समाधान के बारे में ....

Object Detection using SURF

स्रोत

2013-02-14 12:14:10 G453

यह मेरे उद्देश्यों के लिए बहुत धीरे-धीरे और अस्थिर काम करता है (मैं एक बड़ी तस्वीर पर एक छोटे लोगो का पता लगाने की कोशिश कर रहा हूं)। – lizarisk

यदि आपको लगता है कि SURF धीमा है तो आप इसके बजाय ओआरबी का उपयोग कर सकते हैं। लेकिन चमत्कार की उम्मीद न करें, आपको इसे स्थिर बनाने के लिए अपना काम करना होगा। –

ओआरबी मेरे प्रयोगों में एसयूआरएफ और एसआईएफटी की तुलना में काफी खराब प्रदर्शन कर रहा था। मैं इसे और अधिक स्थिर कैसे बना सकता हूं? – lizarisk

लोगो मैं इस बारे में सोच से मेल खाते के लिए आप क्या जरूरत है: http://www.ijera.com/papers/Vol2_issue5/JW2517421747.pdf

स्रोत

2013-02-14 13:50:34

फूरियर वर्णनकर्ता रोटेशन अपरिवर्तनशीलताओं (और अनुवाद के साथ ही स्केलिंग हैं अपरिवर्तनशीलताओं); तो विचार फोरियर डिस्क्रिप्टर परिणाम (जो एसईवी से जुड़े फूरियर डिस्क्रिप्टर पर पीसीए) लॉजिकल पसंद प्रतीत होता है, के साथ आपके कन्फर्मिफायर को प्रशिक्षित करना होगा।

देखें Fourier Descriptors (Wolfram)

स्रोत

2013-02-14 17:29:48 CTZStef

समोच्चों के साथ मुख्य समस्या मजबूती की कमी है - कुछ शोर और पृष्ठभूमि वाली छवियों पर उन्हें सही ढंग से पहचानना असंभव हो सकता है (कुछ पृष्ठभूमि अव्यवस्था ऑब्जेक्ट समोच्च में हस्तक्षेप कर सकती है, अलग-अलग रूपों में एक अयस्क एक विरूद्ध समोच्च विभाजित हो सकता है विभिन्न भागों में, आदि)। लेकिन महान वर्णनकर्ता के लिए धन्यवाद! – lizarisk

चेक बाहर वस्तु का पता लगाने ढांचे https://github.com/nenadmarkus/pico पर उपलब्ध है।

ढांचा आपको कस्टम ऑब्जेक्ट डिटेक्टर सीखने में सक्षम बनाता है (उदाहरण के लिए, सामने वाले, सीधे चेहरों को ढूंढने के लिए) और फिर रोटेशन इनवेरिएंट डिटेक्शन के लिए रनटाइम पर इसका उपयोग करें।

यह ऑब्जेक्ट डिटेक्टर के घूर्णन संस्करण के साथ कई अलग-अलग अभिविन्यासों पर छवि स्कैन करके हासिल किया जाता है। ध्यान दें कि इसे कैस्केड रीट्रेनिंग या इमेज रीसाम्पलिंग के बिना किया जा सकता है, और इसे आधुनिक मशीनों पर वास्तविक समय में काम करना चाहिए (प्रदत्त चेहरा पहचान डेमो करता है)।

विवरण http://arxiv.org/abs/1305.4537 पर उपलब्ध पेपर में दिए गए हैं।

स्रोत

2014-02-14 14:39:18 nmarkus

रोटेशन इनवेरिएंट डिटेक्टर के लिए सबसे अच्छा समाधान क्या है?

उत्तर

संबंधित मुद्दे