का उपयोग कर विशाल फ़ाइलों की तुलना में मेरे पास दो बड़ी टेक्स्ट फ़ाइलें हैं जिनमें प्रत्येक 10 मिलियन से अधिक लाइनें हैं। मैं फ़ाइलों की तुलना कैसे कर सकता हूं और C++ का उपयोग कर फ़ाइलों में अलग-अलग पंक्तियां प्राप्त कर सकता हूं।सी ++
मैंने एक फ़ाइल को स्मृति में लोड करने का प्रयास किया है और स्मृति को सॉर्ट किया है और फ़ाइलों की तुलना करने के लिए बाइनरी पेड़ तर्क का उपयोग किया है। इसकी तुलना ने मुझे 20 सेकेंड में परिणाम दिया। लेकिन यह अधिक स्मृति का उपभोग कर रहा है। (पाठ फ़ाइल लगभग 500 एमबी है)।
मैं अधिक मेमोरी, एक अच्छा प्रदर्शन और हार्ड डिस्क पर कम से कम प्रभाव डालने के बिना दो फाइलों की तुलना करना चाहता हूं।
पहला कदम एक भाषा चुनना है। सी और सी ++ के लिए समाधान अलग होंगे। – juanchopanza
क्या एक diff उपकरण आपकी आवश्यकताओं को पूरा नहीं करेगा? पहिया को पुनर्निर्मित करने से आसान है। – user7116
भाषा को सीपीपी –