2010-05-25 15 views
5

मैं अभी एक स्मार्ट हाउस नियंत्रण प्रणाली बना रहा हूं, और मुझे एक छोटी सी समस्या है। मैं बेस सिस्टम के लिए कॉसमॉस का उपयोग करने और इसके लिए आवश्यक नेमस्पेस लाइब्रेरी जोड़ने के बारे में सोच रहा था, लेकिन सामान्य सिस्टम के रूप में। स्पीच। पहचान नामस्थान विंडोज स्पीच एपीआई पर बहुत अधिक निर्भर करता है, मुझे इसका उपयोग करने के बारे में भूलना होगा।सी # भाषण मान्यता

तो मेरी सवाल है, वहाँ किसी भी (यदि संभव हो तो नि: शुल्क) आवाज की पहचान और/या सी # के लिए भाषण भाषण सिंथेसाइज़र पुस्तकालय है, क्या है निम्नलिखित:

  • बहु भाषा बोल
  • निकालने के लिए समर्थन भाषण के नमूने से पाठ्य सामग्री
  • चयन (या उपयोगकर्ताओं द्वारा लिखी हुई) भाषण पैटर्न (आवाज) के साथ भाषण

एक सामान्य उपयोग, गैर खिड़कियों निर्भर पुस्तकालय woul synthesizing डी सबसे अच्छा हो, और निश्चित रूप से, अगर यह भी मुफ्त था। इस परियोजना के बाहर

+2

वाह, मैं कभी नहीं जानता था कि [अंतर्निहित भाषण मान्यता] (http://msdn.microsoft.com/en-us/library/system.speech.recognition.aspx) .net ढांचे में था। इसके अलावा, [यह] (http://msdn.microsoft.com/en-us/library/system.speech.synthesis.aspx)। –

+0

@ ब्लूराजा - आपको यह जवाब देना चाहिए। मैं तुम्हें उखाड़ फेंक दूंगा। मुझे इसके बारे में भी पता नहीं था। – JasCav

+0

मुझे विश्वास नहीं है कि fonix232 इस के लिए एक माइक्रोसॉफ्ट ओएस का उपयोग नहीं कर रहा है - वह स्पष्ट रूप से आईएल में लिखे गए ओपन-सोर्स ओएस का उपयोग कर रहा है। लिंक http://www.gocosmos.org/index.en.aspx है। –

उत्तर

2

Voxeo offers developer accounts जिसे आप भाषण संचालित घरेलू स्वचालन प्रणाली विकसित करने के लिए उपयोग कर सकते हैं। मैंने अपने घर को समझने वाले आदेशों के एक छोटे से सबसेट के लिए my own home automation system पर इंटरफेस किया है और यह बहुत अच्छा काम करता है। इसका उपयोग करने के लिए आपको कुछ VoiceXML सीखना होगा।

एसएपीआई आवाज संश्लेषण के लिए ठीक काम करता है; मैं घर में बोले जाने वाले संकेतों के लिए अपने सिस्टम में एसएपीआई का उपयोग करता हूं जैसे मौसम में पूर्वानुमान जब आप बाथरूम में जाते हैं तो सुबह में वक्ताओं के सामने आता है। यदि कॉसमॉस आपको उन सभी डीएलएल को शामिल करने की अनुमति नहीं देता है, तो आप एसएपीआई का उपयोग करके एक अलग सेवा बना सकते हैं और फिर डब्ल्यूसीएफ (या अन्य) का उपयोग उनके बीच संवाद करने के लिए कर सकते हैं ??

टाइप किए गए रूप में प्राकृतिक भाषा को समझने की संबंधित समस्या के लिए मैंने C# NLP Engine विकसित किया है, जिसे मैं भविष्य में किसी भी समय गैर-वाणिज्यिक के लिए उपलब्ध कराने में सक्षम होने की उम्मीद करता हूं।

कोई व्याकरण ऊपर-सामने निर्दिष्ट किए बिना भाषण से पाठ निकालना एक बहुत ही कठिन समस्या है और यह त्रुटि प्रवण होने जा रहा है। भले ही आप इसे हल कर सकें, फिर भी आपको एनएलपी का उपयोग करके जो कहा गया है उसे समझने की कोशिश करने की समस्या होगी। एक व्याकरण का निर्माण करना जो पहचानकर्ताओं को उन वाक्यों के प्रकार का मार्गदर्शन करता है जिन्हें आप पहचानना चाहते हैं (जैसे वॉयसएक्सएमएल करता है) बहुत अधिक सटीकता प्राप्त करने की संभावना है।

2

की जांच: http://cmusphinx.sourceforge.net/

यह एक खुला स्रोत वाक् पहचान परियोजना है। यह किसी भी भाषा के साथ प्रशिक्षित है और इसके खुले स्रोत के बाद से आप इसे अपनी आवश्यकताओं के अनुसार संशोधित कर सकते हैं या इसे विस्तारित कर सकते हैं।

+0

एकमात्र समस्या यह है कि यह पूरी तरह से सी # लाइब्रेरी नहीं है। और जैसा कि मैंने कहा, मैं पूरी तरह से सी # लाइब्रेरी का उपयोग करना चाहता हूं, क्योंकि कॉसमॉस को इसकी आवश्यकता होती है। – fonix232

+0

हाय icemanind, मैं सर्वोत्तम संभव परिणाम प्राप्त करने के लिए एक भाषण मान्यता कार्यक्रम की तलाश में हूं, क्या आपको लगता है कि सीएमयू स्फिंक्स मुझे यह पेशकश कर सकता है? –

+0

@ फ़र्नान्डो सैंटियागो - मुझे लगता है कि यह सबसे अच्छा मुफ़्त विकल्प है। यदि आपके पास खर्च करने के लिए पैसा नहीं है, तो इसका रास्ता तय करना है। ध्यान रखें, क्योंकि fonix232 ने बताया, यह शुद्ध सी # नहीं है। इसके पास कुछ सी ++ हुड के नीचे भी है – Icemanind