अब मैं अपने प्रोजेक्ट के साथ काम कर रहा हूं और मैं डेस्कटॉप कंप्यूटर के लिए सिरी जैसी एप्लिकेशन बनाने जा रहा हूं। मैं सोच रहा हूं कि क्या Google स्पीच एपीआई भाषण मान्यता के लिए विश्वसनीय और सटीक है? क्या आप मुझे सुझाव दे सकते हैं भाषण मान्यता के संदर्भ में कौन सा भाषण एपीआई सबसे सटीक है? सबसे अधिक पसंद एक मुफ्त एपीआई। धन्यवाद।Google भाषण API
उत्तर
जबकि Google भाषण API निःशुल्क है, यह एक आधिकारिक सार्वजनिक API नहीं है। कुछ लोगों ने इसे रिवर्स इंजीनियर किया है, जैसा कि discussed in this blog है। यदि आप किसी वाणिज्यिक उत्पाद के लिए सीधे एपीआई तक पहुंचने की योजना बना रहे हैं तो मैं इसकी अनुशंसा नहीं करता क्योंकि वे इसे छोड़ सकते हैं या बिना किसी चेतावनी के इसे बदल सकते हैं, अपने उत्पाद को तोड़ सकते हैं। यह हाल ही में उन डेवलपर्स के साथ हुआ जो Google Weather API का उपयोग करते थे। यदि आप दूसरी ओर x-webkit-speech का उपयोग कर क्रोम ब्राउज़र के माध्यम से इसे एक्सेस कर रहे हैं तो आप शायद सुरक्षित हैं क्योंकि यह Google द्वारा समर्थित है। Google की भाषण मान्यता बहुत अधिक लोकप्रिय व्यावसायिक समाधानों के साथ ठीक है। उनके पास Google Voice और अब निष्क्रिय Google 411 जैसी अन्य परियोजनाओं में इसके साथ बहुत अधिक अनुभव है। उनके पास कुछ शीर्ष भाषण वैज्ञानिक हैं जो उनके लिए काम कर रहे हैं। एकमात्र अन्य मुक्त विकल्प मैं सोच सकता हूं Sphinx है जो कार्नेगी मेलॉन विश्वविद्यालय से एक ओपन सोर्स प्रोजेक्ट है। इस समाधान का उपयोग करके सीखने की वक्र और यदि आप इसे एक सेवा के रूप में स्थापित करना चाहते हैं तो आपको इसे स्वयं विकसित करना होगा। Nuance भाषण मान्यता बाजार में दूसरा बड़ा खिलाड़ी है (मुझे विश्वास है कि सिरी का क्या उपयोग होता है) और उनके पास ऐसे समाधान हैं जो एक सेवा के रूप में भाषण मान्यता प्रदान करते हैं। लेकिन वे मूल्यवान हैं। भाषा समर्थन
विंडोज वाक् पहचान पर टिप्पणियाँ से जवाब पर
अद्यतन अन्य भाषाओं का समर्थन करता है, सबसे वाक् पहचान प्रणाली करता है। लेकिन चेतावनी यह है कि आपको सिस्टम को यह बताना होगा कि किस भाषा का उपयोग करना है और इसे प्रश्न में भाषा का समर्थन करना है। प्रत्येक विक्रेता की भाषाओं की एक सूची होती है जो यह समर्थन करती है और वे एक क्षेत्र के लिए विशिष्ट हैं। उदाहरण के लिए एक विक्रेता मैक्सिकन स्पेनिश, अमेरिकी स्पेनिश और स्पेन स्पेनिश का समर्थन कर सकता है; जिसमें सभी की अलग-अलग बोलीभाषाएं होती हैं। लेकिन भाषण मान्यता इंजन प्रति उपयोगकर्ता एक टाइमर पर केवल एक भाषा/बोली का समर्थन कर सकता है। एक उपयोगकर्ता भाषण मान्यता प्रणाली में कई भाषाओं को बिना किसी भाषा के बदलने के अनुरोध के बिना बोल सकता है।
अन्य ब्राउज़रों में समर्थन की कमी के कारण 3/17/2014
x-webkit-वाक् इनपुट फ़ील्ड बहिष्कृत किया जा रहा है अपडेट किया गया। इसे Web Speech API के साथ प्रतिस्थापित किया जाएगा, जो एक जावास्क्रिप्ट एपीआई है। आप example on how to use it here पा सकते हैं।
मैं Google एपीआई पर केविन के साथ पूर्ण समझौते में हूं। डेस्कटॉप ऐप के लिए सवाल था क्योंकि मैं सिर्फ एक और सुझाव जोड़ूंगा। विंडोज़ अपने डेस्कटॉप और सर्वर ऑपरेटिंग सिस्टम दोनों के लिए मुफ्त भाषण मान्यता प्रदान करता है। अधिक जानकारी के लिए http://stackoverflow.com/questions/4213035/sapi-and-windows-7-problem और http://stackoverflow.com/a/6351055/90236 देखें। –
विंडोज़ भाषण मान्यता के साथ सटीकता के मामले में मुझे परेशानी हो रही है क्योंकि इसे अंग्रेजी में बात करने की आवश्यकता है। मैं भी इस बात का जिक्र कर रहा हूं कि किस एपीआई में भाषण मान्यता के मामले में सबसे सटीक है और यह अन्य डिक्शनरी भी अपनाएगा। धन्यवाद, आप माइकल लेवी, एन के केविन जूनगान। –
आपकी सभी प्रतिक्रिया सर के लिए बहुत बहुत धन्यवाद। मैं अब इस परियोजना के लिए इस Google भाषण एपीआई का उपयोग कर रहा हूं। इसकी शुद्धता के बारे में इसकी अच्छी बात है, लेकिन शायद मैं अगली बार इसे बदल सकता हूं अगर कुछ भाषण एपीआई इस से अधिक सटीकता प्रदान करता है। मैं किस परियोजना पर इसका उपयोग करने जा रहा हूं। धन्यवाद .. –
आप अपना खुद का भाषण पहचानकर्ता चलाने पर विचार करना चाह सकते हैं। सीएमयू स्फिंक्स विशिष्ट ध्वनिक मॉडल प्रदान करता है और मोबाइल उपकरणों में उपयोग के लिए निर्देश बनाता है http://cmusphinx.sourceforge.net/wiki/building –