2012-06-13 23 views
6

मैं C# में एक अच्छा चेहरा, भावना और आवाज पहचान विधि की तलाश में हूं। चेहरे की पहचान के लिए मैं इगु सीवी का उपयोग कर रहा था जो सटीक नहीं है और कम रोशनी की स्थिति में प्रदर्शन बहुत कम है। इसके अलावा मुझे उपयोगकर्ता की भावना को खोजने की ज़रूरत है। चाहे वह उदास या खुश हो। लेकिन मुझे इमू सीवी के साथ यह आसान नहीं मिला।मानव चेहरा, भावना और आवाज पहचान

ध्वनि पहचान के लिए भी मैं अभी तक कोई समाधान नहीं ढूंढ पा रहा हूं, मुझे भाषण मान्यता मिली लेकिन मुझे इसकी आवश्यकता नहीं है।

मैं किसी भी ऑनलाइन एपीआई का उपयोग नहीं करना चाहता हूं। क्या कोई मुझे कोई एसडीके या एल्गोरिदम सुझा सकता है जिसका उपयोग मैं एक चेहरा, भावना और आवाज पहचान लागू करता हूं?

+2

[स्टैक ओवरफ़्लो उत्पाद या सेवा की सिफारिशों प्रदान नहीं करता है] (http://meta.stackexchange.com/a/128562/166663)। – ildjarn

उत्तर

3

चेहरा मान्यता

ध्वनि पहचान

सीधे शब्दों में System.Speech.Recognition Namespace पर एक नज़र डालें (this और this जवाब को देखो)।

1

मुझे समझ में सवाल बहुत पुराना है, हालांकि मैं, के बाद से मैं भी इसी तरह आवेदन पर काम कर रहा हूँ

चेहरा, जज्बात और ध्वनि पहचान के लिए वहाँ अब बहुत सारे उपलब्ध हैं यह करने के लिए योगदान करना चाहते हैं कुछ विकल्प

नीचे खोजने के लिए

1) चेहरा पहचान और मान्यता OpenCV का उपयोग कर: http://ahmedopeyemi.com/main/face-detection-and-recognition-in-c-using-emgucv-3-0-opencv-wrapper-part-1/

प्रो: खुला स्रोत तो मूल रूप से मुक्त। आप अपनी जरूरतों को समायोजित करने के लिए कोड को संशोधित कर सकते हैं। एकाधिक प्लेटफ़ॉर्म समर्थित हैं।

कॉन: शुद्धता सहनशील है लेकिन महान नहीं है। यह पुस्तकालय को आपकी आवश्यकताओं के अनुसार संशोधित करके हल किया जा सकता है।

2) चेहरा पहचान और भावनाओं के साथ मान्यता: कोशिश माइक्रोसॉफ्ट अनुभूति सेवा API

प्रो: बहुत ही सटीक। इसमें एनएलपी, टेक्स्ट टू स्पीच, टेक्स्ट टू स्पीच, कंप्यूटर विजन, आरटी भाषा अनुवादक और अन्य कई अन्य सेवाएं शामिल हैं। सटीकता बहुत अच्छी है क्योंकि सेवाओं को क्लाउड पर होस्ट किया जाता है और हर डेटा इनपुट के लिए प्रशिक्षित किया जा रहा है।

कॉन: भुगतान समाधान। थोडा महंगा। आपको प्रत्येक सेवा के लिए अलग से भुगतान करना होगा।

3) भाषण मान्यता: Google Voice API प्रो: एमएस संज्ञान सेवा के समान। शोर में शुद्धता बेहतर है। con: भुगतान किया गया। एक बार बिक्री वाणिज्यिक उत्पाद के लिए अच्छा नहीं हो सकता

4) भाषण मान्यता और एनएलपी: wit.ai/api.ai प्रो: उपयोग करने के लिए नि: शुल्क। अन्य सार्वजनिक ऐप्स से डेटा का उपयोग कर सकते हैं। शुद्धता अच्छी है। Con: मुझे कोई भी

निम्नानुसार कुछ और लिंक आज़माएं। थोड़ा मदद कर सकते हैं।

एमएस चेहरा एपीआई आधारित सुरक्षा प्रणाली https://www.hackster.io/peejster/facial-recognition-security-system-c6ca6c