मैं बच्चों के लिए कुछ सॉफ्टवेयर पर काम कर रहा हूं, और सॉफ़्टवेयर की कई गैर-भाषण ध्वनियों का जवाब देने की क्षमता को जोड़ना चाहता हूं। उदाहरण के लिए, क्लैपिंग, बार्किंग, व्हिस्लिंग, फार्ट शोर इत्यादि।गैर-स्पीच शोर या ध्वनि पहचान सॉफ्टवेयर?
मैंने अतीत में सीएमयू स्फिंक्स और विंडोज स्पीच एपीआई का उपयोग किया है, हालांकि, जहां तक मैं कह सकता हूं कि इनमें से किसी के भी गैर- भाषण शोर, और वास्तव में मुझे विश्वास है कि सक्रिय रूप से उन्हें फ़िल्टर करें।
सामान्य तौर पर मैं तलाश कर रहा हूँ "मैं इस कार्यक्षमता कैसे मिलता है" लेकिन मैं अगर मैं इसे तोड़ने के तीन प्रश्न है कि क्या अगले के लिए खोज करने के लिए अपने अनुमान कर रहे हैं में नीचे यह मदद मिल सकती है पर शक:
- क्या ध्वनिक मॉडल या उच्चारण लेक्सिकॉन को बदलकर गैर-शब्द ध्वनियों को पहचानने के लिए मुख्य भाषण मान्यता इंजनों में से एक का उपयोग करने का कोई तरीका है?
- (या) क्या गैर-शब्द शोर पहचान करने के लिए पहले से मौजूद एक मौजूदा लाइब्रेरी है?
- (या) मुझे छुपे हुए मार्कोव मॉडल और कॉलेज से आवाज पहचान के अंतर्निहित तकनीक के साथ कुछ परिचितता है, लेकिन कोई अच्छा अनुमान नहीं है कि स्क्रैच से बहुत छोटा शोर/ध्वनि पहचानकर्ता बनाना कितना मुश्किल होगा (मान लीजिए < पहचानने के लिए 20 शोर)। यदि 1) और 2) असफल हो, तो कोई अनुमान है कि यह खुद को रोल करने में कितना समय लगेगा?
धन्यवाद
[मेरा जवाब] (http://stackoverflow.com/q/8285673/22364) प्रश्न [गैर-भाषण की वास्तविक समय पहचान, निरंतर माइक्रोफ़ोन स्ट्रीम से गैर-संगीत ध्वनि] (http: // stackoverflow.com/q/8285673) प्रासंगिक हो सकता है। –