2010-07-28 15 views
28

की अंतर्निहित तकनीक मैं एंड्रॉइड पर एक फेस ट्रैकर लागू कर रहा हूं, और एक साहित्य अध्ययन के रूप में, एंड्रॉइड के फेसडिएक्टर की अंतर्निहित तकनीक की पहचान करना चाहता हूं।एंड्रॉइड के FaceDetector

बस शब्दों में कहें: मैं समझना चाहता हूं कि android.media.FaceDetector वर्गीकरण कैसे काम करता है।

एक संक्षिप्त Google खोज ने कुछ भी जानकारीपूर्ण नहीं कमाई, इसलिए मैंने सोचा कि मैं कोड को देखूंगा।

जावा स्रोत कोड, FaceDetector.java पर देखकर, सीखा जाना बहुत कुछ नहीं है: FaceDetector केवल एक वर्ग है जो छवि आयाम और चेहरों की संख्या प्रदान करता है, फिर चेहरों की एक श्रृंखला देता है।

एंड्रॉइड स्रोत contains the JNI code for this class। मैं समारोह कॉल, जहां, नंगे अनिवार्य करने के लिए कम के माध्यम से पीछा किया, मुझे पता चला:

  1. "FaceFinder" लाइन 90 पर FaceFinder.c:75
  2. में बनाई गई है, bbs_MemSeg_alloc एक btk_HFaceFinder वस्तु (जो करने के लिए समारोह में शामिल रिटर्न वास्तव में चेहरों को ढूँढ़ने में), अनिवार्य रूप से यह btk_SDK_create()
  3. ऐसा लगता है कि कार्यों की भूलभुलैया संकेत और btk_HSDK के उदाहरण के साथ एक दूसरे प्रदान करते हैं, लेकिन कहीं मैं द्वारा मूल btk_HSDK ऑब्जेक्ट को प्रारंभ (भीतर प्रारंभ) (FaceDetector_jni.cpp:145) की hsdkA->contextE.memTblE.espArrE सरणी को कॉपी एक कॉन्सर खोजें sdk->contextE.memTblE.espArrE[0] की ईटीई तत्कालता जिसमें माना जाता है कि जादू है।

मैं क्या की खोज की है, एक छोटे से सुराग है: JNI कोड का संदर्भ एक FFTEm पुस्तकालय है कि मैं के लिए स्रोत कोड नहीं मिल रहा। इसके बावजूद, एफएफटी फास्ट फूरियर ट्रांसफॉर्म है, जो शायद पूर्व-प्रशिक्षित तंत्रिका नेटवर्क के साथ उपयोग किया जाता है। एकमात्र साहित्य मैं इस सिद्धांत के साथ संरेखित कर सकता हूं a paper by Ben-Yacoub et al.

मुझे यह भी सच में नहीं पता कि मैं सही रास्ते पर सेट हूं, इसलिए कोई भी सुझाव निस्संदेह मदद करेगा।

संपादित करें: मैंने किसी भी व्यक्ति के लिए +100 बक्षीस जोड़ा है जो कोई अंतर्दृष्टि दे सकता है।

+0

libFFTEm Android के चेहरे का पता लगाने परत से संदर्भित नहीं है, वास्तव में यह बाहरी में सभी स्रोतों से संकलित उत्पादन होता है/नेवेन – ognian

+0

यही कारण है कि बताते हैं मैं स्रोत कोड नहीं मिला! धन्यवाद; इससे पता चलता है कि अगर यह वास्तव में फास्ट फूरियर ट्रांसफॉर्म का उपयोग करता है, तो इसके बारे में कुछ सबूत 'Neven' में होना चाहिए। हालांकि, वास्तव में मुझ पर कुछ भी नहीं निकलता है। –

+2

ऐसा लगता है कि 'libFFTEm' में "em" रंग-आधारित त्वचा पहचान में उपयोग की जाने वाली एक सांख्यिकीय विधि "अपेक्षा-अधिकतमता" का संदर्भ ले सकता है। – Justin

उत्तर

3

मैं एक फोन पर हूँ, इसलिए बड़े पैमाने पर प्रतिक्रिया नहीं दे सकता है, लेकिन गूगल कीवर्ड "नेवेन दृष्टि एल्गोरिथ्म" कुछ उपयोगी कागजात ऊपर खींचने के ...

इसके अलावा, यूएस पेटेंट 6222939 संबंधित है।

संभवतः भी http://peterwilliams97.blogspot.com/2008/09/google-picasa-to-have-face-recognition.html पर लिंक के कुछ आसान हो सकती है ...

+0

ऐसा प्रतीत होता है कि Google ने हार्टमट नेवन द्वारा दायर विभिन्न पेटेंटों के आधार पर एक ऑब्जेक्ट मान्यता तकनीक, नेवन विजन का अधिग्रहण किया। मुझे एल्गोरिदम का विस्तृत विवरण नहीं मिला है, लेकिन पेटेंट पर पीछा करने से थोड़ा अंतर्दृष्टि मिलती है। –

+0

[इस साइट पर सूचीबद्ध विभिन्न पेटेंट] (http://www.seobythesea.com/?p=267) तकनीक में कुछ अंतर्दृष्टि देते हैं। ऐसा लगता है कि यह [गैबर वेवलेट्स] (http://en.wikipedia.org/wiki/Gabor_filter#Wavelet_space) पर भारी निर्भर करता है। –

4

मैं भी लिंक के एक जोड़े मिले ... सुनिश्चित नहीं हैं कि अगर यह आप में मदद मिलेगी ...

http://code.google.com/p/android-playground-erdao/source/browse/#svn/trunk/SnapFace

http://code.google.com/p/jjil/

http://benosteen.wordpress.com/2010/03/03/face-recognition-much-easier-than-expected/

+0

आपकी प्रतिक्रिया के लिए धन्यवाद, और वे वास्तव में दिलचस्प परियोजनाएं हैं, लेकिन मैं एंड्रॉइड के * अंतर्निर्मित * फेस डिटेक्टर काम करता है ('android.media.FaceDetector') में कुछ अंतर्दृष्टि की तलाश में हूं। –

0

इस पर एक नजर है: http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=1562271

मुझे लगता है कि मैंने एक बार कुछ matlab कोड कर देखा यह एक प्रस्तुति में है। शायद यह कहीं ऑनलाइन है।

नमस्ते, लार्स

+0

मैंने इस लिंक को यहां गुगल किया: शायद यह कोड है। मुझे नहीं पता, मेरे पास कोशिश करने के लिए यहां मैटलैब या स्किलाब नहीं है। हो सकता है कि आपके पास: http://download.cnet.com/Face-Rognognition-in-Fourier-Space/3000-2053_4-10878312.html – Lars

+0

मुझे डर है कि मुझे इस तकनीक का कोई सबूत नहीं मिला है नेवन विजन पर आधारित है। –