2009-06-06 8 views
5

मैं अपने सी # ऐप से पीडीएफ फाइल को पार्स करना चाहता हूं और इसे एक ऑडियो फाइल बना सकता हूं। मैं यह कैसे करूँगा?प्रोग्रामिंग के रूप में .pdf फ़ाइल को कैसे पढ़ा जाए और इसे ऑडियो (.mp3 प्रारूप) में परिवर्तित करें?

मैं विशेष रूप से टेक्स्ट लाइब्रेरी में एक अच्छा पीडीएफ ढूंढ रहा हूं या पीडीएफ फ़ाइल को अपने पाठ से अलग करने का एक तरीका ढूंढ रहा हूं।

+1

पहले मैं हालांकि यह एक मजाक था, और फिर मुझे एहसास हुआ कि आपका मतलब है पाठ को सुनें :) – Zifre

+0

मैं एक्रोबैट रीडर का उपयोग करूंगा! –

+1

@Zifre - भगवान का शुक्र है कि आपने इसे साफ़ कर दिया है, मैं इसके साथ आँसू में फटने वाला था !! – joshcomley

उत्तर

0

मुझे लगता है कि यह करना मुश्किल है। सबसे पहले आपको उस पीडीएफ में पाठ को पढ़ने की जरूरत है, और फिर ऑडियो सामग्री बनाने के लिए सिंथेटिक ध्वनि उत्पादन के कुछ तंत्र का उपयोग करें। फिर आपको इसे एमपी 3 के रूप में स्टोर करना होगा।

2

आपको माइक्रोसॉफ्ट से भाषण एसडीके की आवश्यकता है। एक निर्देश here

4

टेक्स्ट को भाषण के लिए Festival का उपयोग करें। टेक्स्ट एपीआई के लिए विभिन्न पीडीएफ मौजूद हैं ...

+0

ऑडियो फ़ाइलों को उत्पन्न करने के लिए आप महोत्सव का उपयोग कैसे कर सकते हैं? मैं अभी भी इसे समझने की कोशिश कर रहा हूं। –

0

मैक ओएस एक्स पर, आप पीडीएफ के पाठ को निकाल सकते हैं और फिर इसे "कहें" में पाइप कर सकते हैं। आपको अन्य ओएस पर समकक्ष सिंथेथेज़र मिलना चाहिए।

0

यह सब जटिल नहीं है, बशर्ते कि आप पहिया का पुन: आविष्कार न करें, बल्कि इसके बजाय मौजूदा तकनीक (यानी त्यौहार जैसे भाषण इंजनों के लिए टेक्स्ट) का उपयोग करें, साथ ही ओसीआर इंजन पीडीएफ फाइलों को संसाधित करने के लिए ।

सबसे जटिल बात शायद विभिन्न पीडीएफ लेआउट (कॉलम, पंक्तियां, एम्बेडेड ग्राफिक्स, पैर नोट्स, यूआरएल इत्यादि) के साथ काम करना है, जो पाठ पहचान प्रक्रिया को खराब कर सकती है।

हालांकि, आमतौर पर (अगर यह एक शिक्षण अनुभव होना चाहिए नहीं है), यह निश्चित रूप से आसान है सिर्फ मौजूदा सॉफ्टवेयर समाधान का उपयोग करने के लिए सहारा:

5

आप अपने इनपुट दस्तावेज़ के रूप में tagged PDF दस्तावेज़ को अधिमानतः रखते हैं। इसका अर्थ है कि दस्तावेज़ में दस्तावेज़ की तार्किक संरचना को चिह्नित करने के लिए टैग शामिल हैं (आमतौर पर एक पीडीएफ दस्तावेज में केवल दृश्य जानकारी होगी)।

यह पीडीएफ तो DAISY प्रारूप, जो डिजिटल बात कर पुस्तकों के लिए एक मानक है, यानी तार्किक संरचना और नेविगेशन सुविधाओं के साथ पुस्तकों के पाठ भंडारण एक मध्यवर्ती XML स्वरूप है में परिवर्तित किया जा सकता है।

यह डेज़ी एक्सएमएल प्रारूप या तो converted to an audio format हो सकता है, या आप एक डेज़ी पाठक का उपयोग कर सकते हैं, पुस्तक सुनने के लिए एमपी 3 प्लेयर जैसे भौतिक उपकरण का उपयोग कर सकते हैं। पहले आप से पाठ निकाल लिए है

Accessible PDF to DAISY/NIMAS Conversion

2

के रूप में अन्य पोस्टर को रेखांकित किया,:

डेज़ी वेब साइट इस toolchain के सिद्धांतों को स्पष्ट करने के लिए एक प्रस्तुति उपलब्ध नहीं है। पीडीएफ फाइल। पीडीएफ फाइलें अब एक खुला प्रारूप हैं, इसलिए आप शायद Google के माध्यम से एक पार्सर पा सकते हैं।

फिर आपको उस पाठ को निकालना होगा जिसे आप फ़ाइल से भाषण में परिवर्तित करना चाहते हैं, चित्र शीर्षक, पृष्ठ शीर्षलेख, सामग्री की तालिका इत्यादि जैसी चीज़ों को अनदेखा करना।

एक बार जब आपको टेक्स्ट मिल गया, तो आपको इसे भाषण में बदलने की आवश्यकता है। यह शायद सबसे कठिन हिस्सा है।

कुछ समय पहले मैं एक गेमिंग मोड के लिए ध्वनि फ़ाइलों को उत्पन्न करने के साथ झुका रहा था, क्योंकि मैं एक सड़ा हुआ आवाज अभिनेता हूं।

सेप्स्ट्रल में सबसे अच्छा टीटीएस कनवर्टर्स था जो मुझे मिल सकता था। (मुक्त लोगों को भाषण में सेप्स्ट्रल विज्ञापनों को सम्मिलित करने के लिए एक परेशान प्रवृत्ति थी, लेकिन मैं इसे मैन्युअल रूप से संपादित कर सकता था जो मैं कर रहा था।)

यह पता चला है कि एक भाषण संश्लेषण मार्कअप भाषा है जिसका उपयोग प्रदान करने के लिए किया जा सकता है

http://www.w3.org/TR/speech-synthesis/

कैसे आप के बारे में स्वचालित रूप से पाठ करने के लिए SSML जोड़ने जाने मुझे परे एक सा है: टीटीएस कनवर्टर करने के लिए सुराग के बारे में जो लहजे, यहाँ जगह आदि शब्दांश एक पंक्ति है।

वैसे भी, टीटीएस कनवर्टर एक ऑडियो फ़ाइल तैयार करेगा, और अंतिम चरण एमपी 3 प्रारूप में वांछित बिट दर पर ऑडियो को संपीड़ित करना होगा।

2

यदि आपका एकमात्र कार्य पीडीएफ से भाषण संश्लेषित पाठ को सुनना है, तो "व्यू" मेनू के नीचे एक्रोबैट "जोर से पढ़ें" फ़ंक्शन के बारे में कैसे?