2010-09-30 9 views
7

संभव डुप्लिकेट:
Tool to compare large numbers of PDF files?पीडीएफ की तुलना करने के लिए (प्रोग्रामेटिक रूप से) विश्वसनीय तरीका?

मैं क्लासिक परिदृश्य जहां व्यापार आप कोई संशोधन के साथ नए साल के लिए नई पीडीएफ रूपों में से एक गुच्छा देता में हूँ जो भी और आप नोट यह पता लगाना चाहिए कि पिछले वर्ष से अलग क्या है।

मैं यहां फॉर्मों के भारों की बात कर रहा हूं, इसलिए मैं पीडीएफ की तुलना करने के लिए लोगों को बिना किसी एक के माध्यम से मैन्युअल रूप से जाने के बिना अंतर को रेखांकित करने का तरीका खोजने का प्रयास कर रहा हूं।

मेरा विचार पीडीएफ से सभी पाठ निकालना था और इसे एक .txt में डंप करना था, फिर पाठ फ़ाइलों पर अंतर चलाएं, लेकिन यह भयानक लगता है।

मेरा प्रश्न प्रोग्रामेटिक रूप से कहता है, लेकिन मैं पीडीएफ की तुलना करने के लिए किसी भी विश्वसनीय उपकरण से खुश हूं, और मुख्य रूप से लोगों के अनुभवों से एक विचार प्राप्त करना चाहता हूं। किसी भी प्रोग्रामेटिक समाधान का मनोरंजन करने के लिए भी तैयार है (अधिमानतः सी # में, लेकिन किसी भी विचारों को शूट करें)।

+0

यह डुप्लिकेट क्यों है? स्पष्ट रूप से सवाल पूछा गया है कि इसे प्रोग्रामेटिक तरीके से कैसे किया जाए। इंस्टॉल करने योग्य टूल की कोई भी संख्या इस प्रश्न का उत्तर नहीं है। – Vin

उत्तर

8

ऐसे कुछ सॉफ्टवेयर उत्पाद हैं जो भिन्न पीडीएफ का दावा करते हैं। मुझे कभी भी एक का उपयोग करने की आवश्यकता नहीं है, लेकिन अगर यह आवर्ती प्रक्रिया होगी, तो मुझे लगता है कि आपकी कंपनी के लिए उनमें से एक में निवेश करना बुद्धिमान होगा। संभावित अनुप्रयोगों के समूह के लिए बस Google "पीडीएफ diff"।

इसके अतिरिक्त, आपकी स्थिति इस प्रश्न के समान ही है: Tool to compare large numbers of PDF files? मुझे लगता है कि इसकी चर्चा में मदद मिल सकती है।

+0

इसके लिए धन्यवाद - वह प्रश्न वास्तव में बहुत समान है (कुछ कारणों से जब मैंने अपनी रचना की थी तो पॉप अप नहीं हुआ था)। – JohnIdol

4

मैं तुलनात्मक टुकड़े की देखभाल करने के लिए पीडीएफ से कच्चे डेटा को प्राप्त करने, फिर Word या TortiseSVN, या WinMerge, आदि का उपयोग करने के लिए दृष्टिकोण चला गया। मेरे उदाहरण में मैंने सी # में रिचटेक्स्टबॉक्स में तुलना की ... अंतर को रंगना आदि ... क्योंकि हम इसे अपने ऐप के भीतर चाहते थे।

यहां मैंने जो किया है ... PDF comparison क्योंकि मैं मिश्रित दस्तावेज़ों, शब्द और पीडीएफ की तुलना करने की कोशिश कर रहा था।

हालांकि मैं पार्सिंग के लिए PDFBox की सिफारिश करेंगे, थोड़ा और अधिक सुरुचिपूर्ण ... हालांकि iTextSharp बाहर काम ठीक है ...

2

मैं https://blog.idrsolutions.com/2010/09/comparing-2-pdf-files/ पर एक ब्लॉग की तुलना पीडीएफ फाइलों को कुछ दृष्टिकोण का सुझाव दे लिखा

+0

पीडीएफ को छवि में परिवर्तित करें और फिर तुलना करें और अभी भी मानव हस्तक्षेप की आवश्यकता है? यह तब उपयोगी कैसे है? – vsingh

+0

सॉफ़्टवेयर आपको बता सकता है कि क्या उन्होंने नहीं बदला है, इसलिए आप जानते हैं कि आपने कुछ भी तोड़ा नहीं है।केवल एक इंसान किसी भी बदलाव का मूल्यांकन कर सकता है। –

7

मैं Docotic.Pdf Library का डेवलपर हूं। हम जांच के लिए यूनिट परीक्षणों में पीडीएफ तुलना का उपयोग करते हैं कि परीक्षण पीडीएफ को अपेक्षित रूप से उत्पन्न करता है। पीडीएफ विशेष वस्तुओं का संग्रह है और हम ट्रेलर आईडी और निर्माता जानकारी जैसे कुछ गुणों को अनदेखा करते हुए सभी पीडीएफ वस्तुओं की तुलना करते हैं। यह कार्यान्वयन ठीक काम करता है।

आप विधि PdfDocument.DocumentsAreEqual विधि का प्रयास कर सकते हैं। यह विधि केवल बताती है कि विशिष्ट अंतर के बिना आप दस्तावेज़ बराबर हैं। यदि आपको अधिक कार्यक्षमता की आवश्यकता है तो आप हमसे संपर्क कर सकते हैं।