2011-12-31 23 views
10

के साथ पाठ के लिए भाषण के लिए सीएमयू स्फिंक्स 4 का उपयोग कैसे करें मैं अंग्रेजी voxforge मॉडल के साथ sphinx4 या pocketsphinx का उपयोग करने का तरीका जानने का प्रयास कर रहा हूं लेकिन मैं इसे काम नहीं कर सकता। मैंने दस्तावेज़ पृष्ठों को पढ़ने की कोशिश की है (जैसे यह एक http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html) लेकिन यह मेरी मदद नहीं करता है।अंग्रेजी voxforge मॉडल

जो मैं चाहता हूं वह एक निष्पादन योग्य है जहां मैं निर्दिष्ट कर सकता हूं कि कौन सा मॉडल उपयोग करना है और कौन सी ऑडियो फाइल स्रोत के रूप में उपयोग करने के लिए है और निष्पादन योग्य प्रिंट आउट है, यह रिकॉर्डिंग पर आवाज के बारे में सबसे अच्छा अनुमान है।

मैं के साथ कुछ भाग्य हेड:/

pocketsphinx_continuous -infile recording.wav 2>/dev अशक्त लेकिन इससे पहले कि पूरा ऑडियो फ़ाइल ट्रांसक्राइब की जाती है यह aborts और डिफ़ॉल्ट मॉडल एक पठनीय बनाने के लिए कुछ शब्द को waay है ऑडियो से पाठ।

मैंने sphinx4 स्रोत पैकेज में जनसंख्या संकलित और परीक्षण किया है लेकिन सभी उदाहरणों में कुछ शब्दों के लिए प्रतीत होता है और मॉडल को मेरे लिए उपयोगी होने के लिए voxforge को लॉक करने की आवश्यकता होती है।

मैं इसे कैसे सेट अप कर सकता हूं?

+1

मैं स्फिंक्स संशोधित करने में सक्षम किया गया है Voxforge मॉडल का उपयोग कर प्रतिलेखन करने के लिए। बुरी खबर यह है कि वोक्सफोर्ज के साथ भी, स्फिंक्स की सटीकता शर्मनाक रूप से खराब है। मैं स्फिंक्स के साथ अपना समय बर्बाद नहीं करूंगा। यह बिल्कुल उपयोग नहीं है। – Cerin

+0

@Cerin आप एक विकल्प के रूप में क्या सिफारिश करेंगे? –

+0

मुझे विकल्पों में भी रूचि है। क्या आप हमें कुछ बेहतर दे सकते हैं? पसंदीदा मुक्त? – Simon

उत्तर

10

वोक्सफोर्ज ध्वनिक मॉडल में प्लग करना बहुत आसान है।

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

यह इसे पढ़ने के लिए इससे पहले कि आप शुरू अनुशंसा की जाती है: मुख्य एपीआई को कवर दस्तावेज़ cmusphinx ट्यूटोरियल है। कृपया यह भी ध्यान दें कि En_US अंग्रेजी जेनेरिक ध्वनिक मॉडल का उपयोग करने की अनुशंसा की जाती है, यह Voxforge से अधिक सटीक है।

  • डाउनलोड voxforge model sourceforge से और github से
  • चेकआउट sphinx4 एक फ़ोल्डर में खोल दे और Gradle साथ इसे बनाने
  • भागो TranscriberDemo
  • :

    चरण कदम से आप निम्न कार्य करने होंगे Sphinx4-samples/src/main/java/edu/cmu/sphinx/डेमो/ट्रांसक्रिप्बर फ़ोल्डर पर जाएं, Transcriber डेमो खोलें और ध्वनिक मॉडल पथ को नीचे संपादित करें।

  • संपादित स्रोतों में ऑडियो फ़ाइल के स्थान यदि आप
  • भागो डेमो फिर से एक और ऑडियो फाइल की जरूरत है और आनंद

यही होगा यह

// Load model from the folder in your project 
    configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000"); 
+1

बहुत अच्छा जवाब ... मुझे भी इसी तरह की समस्या है कि मैंने SourceForge से voxforge-en-0.3 डाउनलोड किया है, आदि फ़ोल्डर में इतने सारे जार हैं, मैं बस यह नहीं समझ सकता कि कौन सा पथ दिया जाना चाहिए ... कृपया http: // stackoverflow पर जाएं और जाएं।कॉम/प्रश्न/872738 9/श्रुतलेख-अनुप्रयोग-उपयोग-स्फिंक्स 4 – aProgrammer

+0

मुझे यकीन नहीं है कि आप किस बारे में बात कर रहे हैं। आदि में कौन सा जार? बिल्कुल कोई जार नहीं हैं। इस सवाल के लिए, आपने हल करने के लिए समस्या को स्पष्ट रूप से इंगित नहीं किया है, आपको पता नहीं है कि आपके पास क्या समस्या है। –

+0

मैंने आपके उत्तर का पालन किया और Sourceforge से VoxForge डाउनलोड किया, हालांकि मैं इसे स्फिंक्स 4 के साथ उपयोग करने के लिए कॉन्फ़िगर नहीं कर सका। आपने कहा '' संपत्ति का नाम = "स्थान" मान = "फ़ाइल: voxforge_model_folder_name" /> ', हालांकि यह मेरे लिए काम नहीं करता है। तो मैंने वोक्सफोर्ज फ़ोल्डर को ब्राउज़ किया, लेकिन विभिन्न संयोजनों की कोशिश की ... लेकिन अब तक कुछ भी काम नहीं कर रहा है ... कृपया मदद करें !! कृपया संपादित उत्तर देखें .... – aProgrammer