निरंतर भाषण मान्यता?

मेरे आवेदन के हिस्से के रूप में मैं भाषण मान्यता जोड़ना चाहता हूं, लेकिन वास्तव में पारंपरिक अर्थ में नहीं। मेरे पास गीतों का एक गुच्छा है (छंदों में विभाजित) जो किसी के द्वारा गाए जाते हैं, और विचार यह पता लगाना है कि वर्तमान में कौन सी कविता गाई जा रही है ताकि इसे स्क्रीन पर प्रदर्शित किया जा सके।निरंतर भाषण मान्यता?

मैंने स्फिंक्स के साथ खेला है और कुछ बुनियादी उदाहरण स्थापित किए गए हैं और काम कर रहे हैं, लेकिन जब बोले गए पाठ को पंजीकृत करने के आसपास बहुत सारे दस्तावेज प्रतीत होते हैं, जहां आप देरी की प्रतीक्षा कर सकते हैं तो परिणाम संसाधित कर सकते हैं, मैं ' लगातार वाक्य को पहचानने के विचार पर बहुत कुछ नहीं मिलता है। इससे पहले कि मैं उस हिस्से तक पहुंच जाऊं जहां शब्दों को गाया जा रहा है और बोले नहीं!

क्या किसी को इसके साथ कोई अनुभव मिला है, और यदि ऐसा कहीं भी है जो एक अच्छा प्रारंभिक बिंदु प्रदान करेगा? या क्या मैं स्फिंक्स के साथ बहुत महत्वाकांक्षी तरीके से हासिल करने की कोशिश कर रहा हूं और क्या यह वास्तव में सही तरीके से काम नहीं करेगा? मैं अन्य पुस्तकालयों को देखने के लिए खुला हूं लेकिन वे स्वतंत्र होना चाहिए, और स्फिंक्स सबसे व्यापक रूप से बात की गई थी जिसे मैं खोद सकता था।

स्रोत

2011-08-23 berry120

मुझे लगता है कि एक बड़ी समस्या एक उपयुक्त प्रशिक्षण सेट, या सीमित आकार में बूट-स्ट्रैपिंग प्राप्त करने में होगी। – Eamorr

क्या कोई डाउनवोट के कारण की व्याख्या कर सकता है? – berry120

Ggogle [इस आलेख] पर stumbles (http://www.hindawi.com/journals/asmp/2010/546047/) जब मैं किसी खोज में आपके प्रश्न का उपयोग करता हूं। एक विशिष्ट लाइब्रेरी की तलाश करते समय मुझे बहुत मदद नहीं है, मुझे डर है लेकिन अगर आपको कुछ खुद को बनाने की ज़रूरत है तो आपको ट्रैक पर पहुंचने में मददगार हो सकता है। – Wivani

जैसे ही इसे थोड़ी देर के साथ उच्चारण किया जाता है, भाषण को पहचानना पूरी तरह से संभव है। इसके अलावा यदि आप कम या ज्यादा समझते हैं कि आप क्या प्राप्त करने की उम्मीद करते हैं। इसे "आंशिक परिणाम" कहा जाता है और एपीआई के माध्यम से सभी सीएमयूएसफ़िनक्स डिकोडर्स में उपलब्ध है। असल में आप प्रक्रिया में परिकल्पना प्राप्त कर सकते हैं।

वहाँ कैसे इस परिणाम (यह कैसे के स्थिर हिस्सा निकालने के लिए), लेकिन इस तकनीक का बैक ट्रैकिंग कहा जाता है और आसानी से

गायन के लिए लागू किया जा सकता को स्थिर करने पर विचार करने के लिए एक छोटे से मुद्दे, संगीत दिया जा सकता है फ़िल्टर किया गया यह भी करने योग्य है।

स्रोत

2011-09-14 10:22:04

उत्तर

संबंधित मुद्दे