मेरे पास लगभग 100 मिलियन दस्तावेज़ हैं, और मैं दर्पणों के बीच उनके संशोधनों का ट्रैक रखना चाहता हूं। संशोधनों के बारे में जानकारी को प्रभावी ढंग से बदलने के लिए, मैं संशोधित दस्तावेजों के बारे में जानकारी भेज सकता हूं, न कि प्रत्येक अलग दस्तावेज़ द्वारा। कुछ इस तरह:क्या कोई चेकसम एल्गोरिदम है जो इससे "घटाने" डेटा का भी समर्थन करता है?
[ 2012/03/26, cs26],
[ 2012/03/25, cs25],
[ 2012/03/24, cs24],
...
जहां प्रत्येक सीएस की जांच योग है timestamps किसी खास दिन पर बनाए गए सभी दस्तावेज़ों की।
अब, जिस समस्या में मैं चल रहा हूं वह यह है कि मुझे एक एल्गोरिदम नहीं पता है जो दस्तावेज़ को हटाए जाने पर चेकसम से डेटा घटा सकता है। स्पष्ट कारणों से क्रिप्टोग्राफ़िक हैश में से कोई भी ज़रूरत नहीं है, और मुझे सीआरसी के लिए कोई एल्गोरिदम नहीं मिला जो ऐसा करेगा।
एक विकल्प जिसे मैंने माना था, हैश को अतिरिक्त जानकारी जोड़ना था, लेकिन इससे और भी समस्याएं पैदा हो जाएंगी, क्योंकि नोड्स अलग-अलग क्रम में डिलीट अनुरोध प्राप्त कर सकते हैं, और जब कोई नोड पुनरारंभ होता है तो यह सभी को फिर से पढ़ेगा दस्तावेजों से टाइमस्टैम्प, और इस प्रकार हटाए गए लोगों के बारे में जानकारी खो जाएगी।
मैं भी सभी दस्तावेज़ हैंश मेमोरी के साथ हैश पेड़ का उपयोग नहीं करना चाहूंगा, क्योंकि यह लगभग 8 गीगा मेमोरी का उपयोग करेगा, और मुझे लगता है कि यह केवल इस आवश्यकता के लिए ओवरकिल है।
अब के लिए सबसे अच्छा विकल्प पृष्ठभूमि में समय-समय पर इन हैंश को पुन: उत्पन्न करने लगता है, लेकिन यह भी बहुत आवश्यक ओवरहेड है, और परिवर्तनों पर तत्काल जानकारी प्रदान नहीं करेगा।
तो, क्या आप लोग चेकसम एल्गोरिदम के बारे में जानते हैं जो मुझे चेकसम से कुछ डेटा "निकालने" देगा? मुझे एल्गोरिदम को कुछ हद तक तेज़ होने की आवश्यकता है और चेकसम जो सबसे छोटे बदलावों को दृढ़ता से इंगित करेगा (यही कारण है कि मैं वास्तव में सादा एक्सओआर का उपयोग नहीं कर सकता)।
या शायद आपके पास पूरे डिज़ाइन के बारे में बेहतर विचार हैं?
मुझे यह नहीं मिला। आप एक्सओआर सभी चेक-रकम क्यों नहीं कर सकते हैं। यदि एक दस्तावेज़ हटा दिया जाता है, तो आप XOR उन दस्तावेज़ों पर चेकसम पर जाते हैं, और आपके पास बाकी फ़ाइलों के लिए चेकसम होना चाहिए। – aioobe
आपके प्रति दिन कितने संशोधन हैं? क्या आप संशोधन के लिए सिर्फ चेकसम नहीं कर सकते थे? – biziclop
@aioobe मैं वास्तव में विशेष दस्तावेजों के लिए अलग-अलग चेकसम नहीं रखता हूं, इसलिए यह मेरे दिमाग को पार नहीं कर पाया लेकिन हां, यह एक अच्छा विचार है, अनिवार्य रूप से जेसन एस ने वही बात सुझाई है –