2012-08-03 5 views
7

मैं माइक्रोसॉफ्ट भाषण सी # एपीआई का उपयोग कर रहा हूँ होम ऑटोमेशन आदेशों के लिएमाइक्रोसॉफ्ट स्पीच का उपयोग कर वॉयस पैटर्न से स्पीकर की पहचान कैसे करें?

मैं अगर वहाँ एक ही रास्ता या है जानना चाहते हैं में निर्मित सी # विधि वॉयस इनपुट हैश और पहचान कौन बोल रहा है करने के लिए। यदि ऐलिस या बॉब "हैलो एलिस" या "हैलो बॉब" कहने के लिए है।

संपादित करें:

माइक्रोसॉफ्ट वाक् API रिकॉर्डिंग का एक .wav प्रदान करता है सकते हैं।

  • जोर से आवाज, धीमी गति से मॉडुलन, ... => बॉब
  • उच्च आवाज, तेजी से मॉडुलन, ... => ऐलिस: यह हैश करने के लिए, प्रक्रिया, ... को समझने के लिए कौन बोल रहा है सक्षम हो सकता है
+0

मैं का उपयोग कर जवाब के लिए नहीं देख रहा हूँ (Kinect कंकाल) या 2 कदम पहचान (आरएफआईडी टैग की तरह) –

+0

@VamsiKrishna कोई आप समझ में नहीं आया:

आप अपने सी # & अजगर यहाँ SDKs पा सकते हैं। मैं आवाज मॉड्यूलेशन के आधार पर ऐलिस या बॉब बोल रहा हूं, यह जानने का एक तरीका ढूंढ रहा हूं। माइक्रोसॉफ्ट स्पीच एक .wav प्रदान कर सकता है जिसे संसाधित या धोया जा सकता है? यह जानने के लिए कि कौन बोल रहा है –

+2

@StackUnderflow मैं सहमत हूं लेकिन एक जवाब स्वीकार करने के लिए यह अच्छा होना चाहिए। गलत चीजों का जवाब देना बहुत आसान है। और StackOverflow गुणवत्ता में कमी। –

उत्तर

2

अध्यक्ष मान्यता एक कठिन समस्या है और अभी भी एक सक्रिय अनुसंधान क्षेत्र है। मुझे नहीं लगता कि माइक्रोसॉफ्ट भाषण एपीआई में कोई स्पीकर पहचान समर्थन है, लेकिन 100% निश्चित नहीं है।

मुझे विषय का शोध करते समय निम्नलिखित लेख वास्तव में उपयोगी पाया गया। यह विषय प्रस्तुत करता है और एक बहुत ही कच्चे कार्यान्वयन प्रदान करता है। शायद शुरू करने के लिए एक अच्छी जगह है।

http://www.ibm.com/developerworks/opensource/library/os-sndpeek/index.html

+0

ओह बहुत इंटरस्टेस्टिंग! धन्यवाद। मुझे उम्मीद है कि कुछ वक्ताओं (नर/मादा) की पहचान करने के लिए एक कड़वाहट रास्ता होगा। –

0

ऐसा लगता है कि अध्यक्ष Diarization समस्या को हल करने की कोशिश कर रहे (खोजने जो बोलता है जब); इसके लिए इंटरनेट पर कई टूलकिट उपलब्ध हैं। मैं LIUM: http://www-lium.univ-lemans.fr/diarization/doku.php नामक एक (जावा पर चलाएं) की अनुशंसा कर सकता हूं।

यदि आप ऐलिस और बॉब को अलग करने पर बस दिलचस्प हैं, तो आप ऊपर दी गई वेबसाइट के स्क्रिप्टिंग पेज में लिंग डिटेक्शन भाग देख सकते हैं (या सीधे http://www-lium.univ-lemans.fr/diarization/doku.php/gender_detection पर जाएं)।

1

आप इस कार्य को करने के लिए माइक्रोसॉफ्ट अध्यक्ष मान्यता API का उपयोग कर सकते हैं: https://www.microsoft.com/cognitive-services/en-us/speaker-recognition-api

माइक्रोसॉफ्ट इस उद्देश्य के लिए दो एपीआई प्रदान कर रहा है: स्पीकर सत्यापन & अध्यक्ष पहचान। https://github.com/Microsoft/ProjectOxford-ClientSDK/tree/master/SpeakerRecognition