2012-06-21 7 views
6

क्षमा करें अगर यह दोहराना सवाल है, लेकिन मैंने इसे कहीं भी नहीं देखा।मैक के लिए अच्छा भाषण मान्यता इंजन, आईओएस नहीं?

मै मैक प्रोग्राम पर काम कर रहा हूं जो वॉयस कमांड लेगा, और NSSpeechRecognizer मेरे लिए काफी कुछ नहीं कर रहा है।

मैं कुछ और भी अधिक गतिशील तो मैं अलार्म सेट कर सकते हैं चाहते हैं, बनाने दिनांकों, अधिक प्राकृतिक आदेशों देना, आदि

हर खुला स्रोत वाक् इंजन मैंने पाया आईओएस की ओर बनाया गया है, । ओपनर्स/vocalkit आदि अभी भी मैक कार्यक्रमों के लिए ठीक काम करते हैं?

+1

साथ ही आप माउंटेन शेर के लिए इंतजार और उम्मीद है कि सेब डेवलपर्स के लिए एक डिक्टेशन एपीआई विज्ञप्ति सकता है के बारे में है। – TheAmateurProgrammer

+1

@theAmateurProgrammer: लेकिन शायद ऐप्पल की सिरी सेवा द्वारा समर्थित किया जाएगा और एक इंटरनेट कनेक्शन की आवश्यकता होगी (और यदि आप आईबीएम में काम करते हैं तो आप इसका उपयोग नहीं कर सकते हैं)। मुझे लगता है कि ओपी कुछ ऐसी चीज मांग रहा है जो स्थानीय रूप से काम करता है। – Thilo

+0

मुझे विश्वास नहीं है कि उन्होंने डब्ल्यूडब्ल्यूडीसी में माउंटेन शेर को सिरी जोड़ने के बारे में कुछ भी बताया है, केवल भाषण से पाठ (सभी टेक्स्टबॉक्स में डिक्टेशन फीचर उर्फ) जाने की क्षमता ला रहा है। – TheAmateurProgrammer

उत्तर

3

भाषण मान्यता असाधारण रूप से गैर-तुच्छ है। मुक्त इंजन जो किसी कारण से मुक्त हैं। यदि आप किसी भी राशि (जैसे अलार्म लेबल) में श्रुतलेख की अपेक्षा करते हैं, तो आप भाग्य से बाहर हैं। सिरी को एक संपूर्ण डेटा सेंटर की आवश्यकता है। उपलब्ध ओपन सोर्स पैकेज आपको सरल टेलीफोन ऑटो-अटैचमेंट्स से ज्यादा नहीं मिलेगा।

जब तक आपके पास व्यापक आंकड़े पृष्ठभूमि और खाली समय न हो, तो मैं अनुशंसा करता हूं कि आप एक वाणिज्यिक पुस्तकालय या सर्वर कार्यान्वयन लाइसेंसिंग का पीछा करें। कार्नेगी मेलन से

+0

महामारी सही है। मैं यह भी जोड़ूंगा कि आपको आवश्यक गतिशील कार्यक्षमता को दो अलग-अलग कारकों के खिलाफ माना जाना चाहिए: 1. भाषण मान्यता और 2. प्राकृतिक भाषा प्रसंस्करण क्षमताओं। – kineticfocus