6

के माध्यम से ध्वनि पहचान प्रोग्रामिंग मैं एक आवाज पहचान प्रोग्राम बनाना चाहता हूं जो विंडोज भाषण मान्यता और कुछ और कार्यों की तरह काम करता है। आप किस प्रकार का प्रोग्राम सुझाते हैं मैं शुरू करता हूं?जावा स्पिंक्स 4

क्या स्पिंक्स 4 एक सिरी/विंडोज भाषण मान्यता प्रकार प्रोग्राम बनाने के लिए अच्छा है?

जो मैं बनाने की कोशिश कर रहा हूं वह एक एआई प्रोग्राम है यदि आप करेंगे।

+2

क्या आपने इस प्रश्न से पूछने से पहले कोई शोध किया है? चूंकि यह खड़ा है कि यह प्रश्न बहुत व्यापक है और दूसरों के किसी भी प्रकार के अर्थपूर्ण तरीके से जवाब देना आसान नहीं होगा। इन प्रकार के प्रश्न आमतौर पर ओपन एंड प्रकृति के कारण SO पर बंद होते हैं। आप इसे और अधिक विशिष्ट होने के लिए कोशिश करना और फिर से लिखना चाहते हैं। – slm

+0

मुझे सिर्फ एक पेशेवर राय की आवश्यकता है कि यह प्रोग्राम एक सिरी प्रकार का कार्यक्रम बनाने के लिए उपयोगी है या नहीं? –

+0

यदि आप एक विशिष्ट कार्य के लिए सॉफ़्टवेयर के एक टुकड़े की संभावना को मापने के लिए देख रहे हैं तो मैं किसी भी स्टैकएक्सचेंज साइट से पहले Google को हिट करूंगा। यहां एक लिंक है जिसे कोई व्यक्ति अपने ब्लॉग पर पोस्ट करता है जो इस मुद्दे पर चर्चा करता है। http://andrewbrobinson.com/2012/02/29/speech-recognition-using-sphinx-dont-try-this-at-home/ – slm

उत्तर

10

हाँ स्फिंक्स 4 आप क्या चाहते हैं के लिए अपनी सही, अपने एक बहुत ही परिष्कृत भाषण मान्यता प्रणाली है, और उसके बाद से इतना लोकप्रिय आप यह कैसे का उपभोग करने पर उपलब्ध ट्यूटोरियल की एक बहुत कुछ है:

मुख्य वेबपेज: http://cmusphinx.sourceforge.net/sphinx4/

कुछ ट्यूटोरियल:

  1. http://www.youtube.com/watch?v=GeqtLrcOogs

  2. http://puneetk.com/speech-recognizer-in-java-tutorial

अब इस आप आदानों में आवाज चालू करने के लिए, और उसके बाद आप आदेश बनाने के लिए उन आदानों पार्स करने के लिए होगा की अनुमति देगा।

  1. एक भाषण से पाठ विश्लेषक, यही कारण है कि sphinx4 होगा: आवेदन की तरह आप 3 COMPONENTES जरूरत

    तो एक सिरी बनाने के लिए।

  2. एक व्याकरण विश्लेषक, जो आपका पार्सर होगा, यह सरल या बहुत जटिल हो सकता है।
  3. सेवाओं का एक सेट, चीजों को ऐ उन आदेशों

आप कोशिश करते हैं और चीजों को साधारण रखने के लिए और ध्यान केंद्रित करने के लिए है के साथ क्या होगा। यही कारण है कि सिरी बहुत अच्छी तरह से काम करता है।

  1. एक चेतावनी के लिए पूछें:

    यह आपको सिरी पूछ सकते हैं चीजों की एक सूची है।

  2. एक टेक्स्ट भेजने के लिए कहें।
  3. मौसम के बारे में पूछें।
  4. जानकारी के लिए पूछें (येलप, वोल्फ्राम | अल्फा, या विकिपीडिया से)।
  5. मीटिंग सेट करने के लिए कहें।
  6. एक ईमेल भेजने के लिए कहें।
  7. एक संख्या के लिए पूछें।
  8. अलार्म सेट करने के लिए कहें।
  9. दिशानिर्देशों के लिए पूछें।
  10. स्टॉक के बारे में पूछें।
  11. टाइमर सेट करने के लिए कहें।
  12. सिरी से सिरी से पूछें।

भले ही वह अधिक खुली और गतिशील प्रतीत होती है, वास्तव में सिरी उन चीजों में बहुत सीमित है जो वह कर सकती हैं।मुझे गलत मत समझो मुझे लगता है कि सिरी अद्भुत है और किसी भी तरह से मैं प्रोग्रामिंग कह रहा हूं कि सिरी जैसे कुछ आसान होगा (मैं शर्त लगाता हूं)।

उम्मीद है कि यह मदद करता है।

+0

धन्यवाद, यह मुझे शुरू करने के लिए काफी अच्छा है। –