5

मुझे एक दृश्य में एक आईफोन और एंड्रॉइड पर वस्तुओं का पता लगाने की जरूरत है। पर्यावरण इस तरह से बाधित है कि समस्या को आसान और अधिक सटीक बनाना चाहिए:क्या एक ज्ञात सेटिंग में वस्तुओं को पहचानने के लिए उपयुक्त एक छवि प्रसंस्करण लाइब्रेरी/एआर तकनीक उपयुक्त है?

  1. पर्यावरण छोटा और ज्ञात है ... उपयोगकर्ता एक कमरे या छोटे आउटडोर क्षेत्र की खोज कर रहे हैं जिसमें मैं आगे की तस्वीरें ले सकता हूं "प्रशिक्षित" करने के लिए या एल्गोरिथ्म
  2. अंतरिक्ष के भीतर उपयोगकर्ता के स्थान अक्सर सीमित है विवश समय ... यहां तक ​​कि जब अंतरिक्ष बड़ा है, उपयोगकर्ता विशिष्ट पथ के लिए अंतरिक्ष
  3. वस्तुओं का पता लगते ही हैं भीतर तक ही सीमित किया जा सकता है अपेक्षाकृत स्थैतिक ... वे पर्यावरण का हिस्सा हैं और
स्थानांतरित नहीं करते हैं

लेकिन, समस्या कठिन बना रही है:

  1. मैं वस्तुओं पर मार्कर लगाने से वातावरण संशोधित नहीं कर सकते, तो मैं खुद वस्तुओं को पहचान करने की जरूरत है
  2. वस्तुओं सुंदर समान लग रही हैं, इसलिए हम हो सकता है आस-पास के दृश्य को इनपुट के रूप में उपयोग करने के लिए, न केवल व्यक्तिगत आइटम

उदाहरण के लिए, पथ के साथ एक ऐतिहासिक कब्रिस्तान (आपको घास पर चलने की अनुमति नहीं है) के माध्यम से चलने की कल्पना करें। जब कोई उपयोगकर्ता हेडस्टोन पर अपने फोन को इंगित करता है, तो मैं हेडस्टोन की पहचान करने और अनुमान लगाने में सक्षम होना चाहता हूं कि उपयोगकर्ता हेडस्टोन से संबंधित है (इसलिए मैं पथ पर उपयोगकर्ता का स्थान अनुमान लगा सकता हूं)। यदि आप केवल हेडस्टोन देख रहे हैं तो कई हेडस्टोन बहुत समान दिख रहे हैं। समय से पहले मैं उस पथ पर चल सकता हूं और विभिन्न कोणों से वस्तुओं की कई तस्वीरें ले सकता हूं।

क्या इस प्रकार की ऑब्जेक्ट डिटेक्शन समस्या के लिए उपयुक्त कोई एल्गोरिदम या लाइब्रेरी है?

उत्तर

1

यह कुछ आप के लिए देख हो सकता है: वे जहां आप क्या चाहते हैं के करीब कुछ हो सकता है अपने स्वयं के पुस्तकालय है http://3dar.us/

(वस्तुओं के स्थानों, अपने स्थान, दूरी, आदि) केवल चेतावनी है यह अभी आईफोन के लिए है? तुम्हारी खोज के लिए बधाई!

0

यदि आस-पास के दृश्य एक दूसरे से पर्याप्त रूप से भिन्न हैं तो आप हिस्टोग्राम मिलान जैसी सरल तेज़ तकनीक का उपयोग करके दृश्यों के बीच अंतर करने में सक्षम हो सकते हैं। इसका उपयोग यह निर्धारित करने के लिए किया जा सकता है कि आप किस दृश्य में हैं, और खोज सेट को संकीर्ण करते हैं। यदि आप दृश्यों को अलग कर सकते हैं, तो आप किसी ऑब्जेक्ट-डिटेक्शन मोड पर स्विच कर सकते हैं जो किसी विशिष्ट दृश्य में अपेक्षित विशिष्ट ऑब्जेक्ट की तलाश करता है। मुझे कल्पना है कि ऑब्जेक्ट स्थिर और अच्छी तरह से प्रलेखित है, तो आप सबसे पहचानने योग्य फीचर डिस्क्रिप्टर के पूर्व-संकलित सेट के खिलाफ खोज करने में सक्षम हो सकते हैं, उनसे सापेक्ष मुद्रा निर्धारित कर सकते हैं आदि। पीटीएमएम का दृष्टिकोण व्यापक रूप से इसके समान है (दृश्य निर्धारित करें, दृश्य के फीचर पॉइंट लोड करें, वर्तमान दृश्य में ट्रैक करें)।

यदि आपका उदाहरण (मिलान करने वाले हेडस्टोन) वास्तव में आप कोशिश कर रहे हैं, तो समस्या बहुत कठिन हो जाती है (मुझे लगता है कि कम से कम सतही रूप से अधिकांश हेडस्टोन और पृष्ठभूमि ज्यामिति, रंग इत्यादि जैसी चीजों में बहुत समान होंगी) । पथ की बाधा का मतलब है कि आप असर के अनुसार अपने खोज सेट को संकीर्ण करने में सक्षम हो सकते हैं (जब तक कि सभी हेडस्टोन एक ही दिशा का सामना नहीं कर रहे हों)। इसके बाद आपको शेष बकाया विशेषताओं (टेक्स्ट?) के साथ सबसे अच्छा करना होगा।

 संबंधित मुद्दे

  • कोई संबंधित समस्या नहीं^_^