में वॉयस डिटेक्शन मैं एक साधारण सी # रीयल-टाइम वॉयस डिटेक्शन लाइब्रेरी की तलाश में हूं। इनपुट एक ऑडियो स्ट्रीम होना चाहिए, और आउटपुट "मानव आवाज" या "मानव आवाज नहीं" होना चाहिए। मुझे भाषण मान्यता या सिग्नल प्रोसेसिंग में कोई ज्ञान नहीं है, और मैं किसी भी तरह की सहायता की सराहना करता हूं।सी #
सी #
उत्तर
"Detecting audio silence in WAV files using C#" के उत्तर पर एक नज़र डालें। मुझे लगता है कि इनपुट एक डब्ल्यूएवी फ़ाइल है। यदि नहीं, तो कृपया ऑडियो स्ट्रीम का प्रारूप प्रदान करें, या यदि आप सीधे माइक्रोफ़ोन से इनपुट लेने का इरादा रखते हैं। यदि आप ऑडियो स्ट्रीम में चुप्पी की मात्रा को माप सकते हैं और आप ऑडियो स्ट्रीम की अवधि जानते हैं तो आप टॉकटाइम की मात्रा की गणना कर सकते हैं। उत्तर में लिंक मृत है, लेकिन यदि आप codeproject.com पर जाते हैं और "सी # वेव फॉर्म" पर खोज करते हैं तो आपको कई परियोजनाओं पर एक हिट मिलेगी जो आपको दिखाती है कि Wav फ़ाइलों को कैसे समझना और कुशल बनाना है। पृष्ठभूमि शोर होने पर मौन का पता लगाना थोड़ा सा व्यक्तिपरक हो सकता है। आपको चुप्पी के लिए न्यूनतम वॉल्यूम थ्रेसहोल्ड लेने की आवश्यकता होगी, जहां इसके नीचे कुछ भी मौन माना जाता है।
आप यह निर्धारित करने का इरादा कैसे रखते हैं कि मानव आवाज क्या है और क्या नहीं है? यह एक साधारण समस्या नहीं है, लेकिन यदि आप जो कुछ हासिल करने की कोशिश कर रहे हैं उस पर कुछ पैरामीटर डाल सकते हैं, तो हम एक दिशा का सुझाव दे सकते हैं। – Brad
मैं यह मापने की कोशिश कर रहा हूं कि स्पीकर टॉक कितनी देर तक चलता है, और उसके विराम कितने समय तक हैं। –
ए _similar_ लेकिन समान प्रश्न का उत्तर नहीं दिया गया था [यहां] (http://stackoverflow.com/questions/227140/c-sharp-speech-recognition-is-this-what-the-user-said "), शायद यह जानकारी उपयोगी होगा। – eli