का उपयोग कर पीडीएफ को व्यावहारिक पाठ में परिवर्तित करना क्या कोई पुस्तकालय है जिसमें सी # .net में पीडीएफ फ़ाइल से पाठ निकालने के लिए कक्षा है? मैंने कुछ कोशिश की है लेकिन दस्तावेज़ीकरण भयानक है, इसलि
sed या इसी तरह का उपयोग करना आप फ़ाइल से लाइनों को कैसे निकालेंगे? अगर मैं फाइल से लाइन 1, 5, 1010, 20503 चाहता था, तो मुझे इन 4 लाइनों को कैसे प्राप्त होगा? क्या होगा यदि मेरे पास निकालने की आवश्यकता
मैं एक पीडीएफ लाइब्रेरी की तलाश में हूं जो मुझे पीडीएफ दस्तावेज से पाठ निकालने की अनुमति देगा। मैंने पीईपीडीएफ को देखा है, और यह टेक्स्ट को पीडीएफ दस्तावेज से बहुत अच्छी तरह से निकाल सकता है। इसके साथ
से टेक्स्ट एक्सट्रैक्शन मैं ऐसे प्रोग्राम पर काम कर रहा हूं जो HTML पृष्ठों को डाउनलोड करता है और फिर कुछ जानकारी का चयन करता है और इसे दूसरी फ़ाइल में लिखता है। मैं पैराग्राफ टैग के बीच की जानकारी को