2012-04-24 11 views
5

2004 के अपने पेपर में, "स्केल-इनवेरिएंट कीपॉइंट्स से विशिष्ट छवि विशेषताएं", उन्होंने XXX के एक समारोह के रूप में "दोहराने योग्यता" के कई आंकड़े दिए, उदाहरण के लिए, 3,4 और 6 आंकड़े, लेकिन उन्होंने विस्तार से बताया कि कैसे "दोहराने योग्यता" की गणना करें।लोवे अपने एसआईएफटी एल्गोरिदम की "दोहराने योग्यता" की गणना कैसे करता है?

उन्होंने वास्तव में पृष्ठ 8 के आकृति 3 में "दोहराने योग्यता" का एक सरल स्पष्टीकरण दिया, जो "मुख्य बिंदुओं का प्रतिशत है जो दोहराए गए स्थान पर दोहराए गए हैं और एक रूपांतरित छवि में पैमाने पर"।

हालांकि, 1) हम मौसम को कैसे जानते हैं, परिवर्तित छवि में एक मुख्य बिंदु का पता लगाया गया है, बस एक-एक करके कुंजीपटलों की जांच करके? मुझे नहीं लगता कि यह व्यावहारिक है, क्योंकि हजारों कीपैंट हैं।

2) हम उसी स्थान पर दोबारा एक महत्वपूर्ण बिंदु को दोहराया जा सकता है? 3 पिक्सेल, 6 पिक्सल? या पिक्सल से बिल्कुल नहीं?

मुझे नहीं पता कि मैं पेपर "स्केल-इनवेरिएंट कीपॉइंट्स से विशिष्ट छवि विशेषताएं" कैसे अपलोड कर सकता हूं। यहां लिंक है: http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

+0

संदर्भ/लिंक कृपया। – RBarryYoung

+0

लिंक जोड़ा गया। thx – user1222309

उत्तर

3

यदि आप पेज 9 पर पहले पैराग्राफ में देखते हैं, तो लेखक एक ही स्थान पर मुख्य बिंदु का पता लगाने के लिए सहिष्णुता पर थोड़ी अधिक जानकारी देता है। सबसे पहले, "एक ही पैमाने" को सही पैमाने के sqrt(2) के कारक के रूप में दिया जाता है, जिसे या तो डेटा सेट में लेबल किए गए ऑपरेटर या हाथ से जाना जाना चाहिए। दूसरा, "वही स्थान" को x और y दिशाओं में σ पिक्सल के रूप में परिभाषित किया गया है, जहां "σ कुंजीपटल का स्तर है (समीकरण (1) से परिभाषित अंतर के रूप में उपयोग किए जाने वाले सबसे छोटे गॉसियन के मानक विचलन के रूप में- ऑफ गॉसियन फ़ंक्शन) "

आपके सामान्य प्रश्न के रूप में, उत्तर दुर्भाग्यवश है कि किसी को वास्तव में मुख्य बिंदुओं को पूरी तरह से जांचना चाहिए। आप सभी स्थान/स्केल जोड़े एकत्र करते हैं जहां आपका डिटेक्टर परिवर्तित छवि पर आग लगाता है, और आप इन्हें मूल छवि में वास्तविक स्थानों पर तुलना करते हैं। आपको हाथ से रिकॉर्ड किए गए कीपॉइंट स्थानों की आवश्यकता है, या पहले एक साधारण एल्गोरिदम चलाएं (जैसे कि मूल केएलटी कीपॉइंट डिटेक्टर का उपयोग करना और केवल उन महत्वपूर्ण बिंदुओं के निर्देशांक की एक सूची संग्रहीत करना जो इन्हें पाता है और इन्हें "ग्राउंड सच्चाई" है ... आप इस तरह से कुछ सटीकता भुगतना होगा लेकिन आप प्रक्रिया को स्वचालित करने में सक्षम होंगे)।

इस तरह बड़े पैमाने पर कड़वाहट काम (कुंजीपटलों का एक टन जांचने के लिए कोड लिखना) आम तौर पर उन छात्रों को तैयार करता है जो छात्रों को धीरे-धीरे खेती करते हैं। Blerg।

+0

"वही स्थान" को x और y दिशाओं में σ पिक्सल के रूप में परिभाषित किया गया है, जहां "σ कुंजीपटल का स्तर है (समीकरण (1) से परिभाषित अंतर के रूप में उपयोग किए जाने वाले सबसे छोटे गॉसियन के मानक विचलन के रूप में- गॉसियन फ़ंक्शन) "। तो बड़े पैमाने पर कीपॉइंट, कहें, 3 σ, एक छोटे पैमाने के साथ कीपॉइंट के साथ समान सहिष्णुता होगी, 1.5 σ कहें? – user1222309

+0

यह कागज से सीधा उद्धरण है, इसलिए समीकरण (1) कागज को संदर्भित करता है ... – ely

+0

मैं समीकरण (1) को समझता हूं, जो मुझे समझ में नहीं आता है कि सहिष्णुता "σ पिक्सेल" सभी महत्वपूर्ण बिंदुओं के लिए है, जो का मतलब है बड़े पैमाने पर (3σ) के साथ कीपॉइंट, एक छोटे पैमाने (1.5σ) के साथ कीपॉइंट के साथ समान सहिष्णुता होगी, जो उचित नहीं है, मुझे लगता है। क्या आप मुझे एक संकेत दे सकते हैं? – user1222309