मर्कले पेड़ (उर्फ हैश पेड़) का उपयोग "कैसंड्रा" & "डायनेमो" दोनों में डेटा सिंक्रनाइज़ेशन के लिए किया जाता है।मर्कल ट्री डेटा सिंक्रनाइज़ेशन झूठी पॉजिटिव्स
किसी भी हैश फंक्शन के साथ के रूप में, वहाँ एक संभावना विभिन्न डेटा एक ही हैश मान हो सकता है है:
मौजूद है एक x और y जहां [! Y = x] लेकिन [हैश (x) = हैश (वाई)]
जैसा कि एनओएसक्यूएल में "बड़ा डेटा" बढ़ता है, ऐसे डेटा का सामना करने की संभावना अधिक हो जाती है।
इसका मतलब है कि जैसे डेटा सेट बड़ा हो जाता है, यह लगभग निश्चित है कि मर्कल पेड़ में विभिन्न नोड्स एक ही पैरेंट हैश उत्पन्न करेंगे।
इस तरह के अवसर पर, जब क्लस्टर में दो अलग-अलग मशीनें अपने मर्कल पेड़ों को पार करती हैं, तो उन्हें झूठा सकारात्मक मिलेगा कि उनका डेटा सुसंगत है। यदि पेड़ की उस शाखा में कोई और डेटा नहीं लिखा गया है, तो मशीनें हमेशा के लिए अनसंक्रनाइज़ रहेंगी।
यह कैसे संभाला जाता है?
क्या कोई अन्य सिंक तंत्र है जो आखिरकार यहां लात देगा? या क्या ये डेटाबेस बस हैश-फ़ंक्शंस को समान रूप से वितरित किए जाने पर भरोसा करते हैं? मैं आपको याद दिलाता हूं कि कैसंद्रा के मामले में अधिकांश उपयोगकर्ता डिफ़ॉल्ट हैश फ़ंक्शन के साथ जाते हैं, जो शायद इष्टतम वितरण नहीं होता है। – eshalev
नहीं, अधिकांश सिस्टम समान रूप से वितरित किए जा रहे हैंश-फ़ंक्शंस पर भरोसा करते हैं (वे [SUHA] (http://en.wikipedia.org/wiki/SUHA_ (computer_science) पर भरोसा करते हैं)। और मुझे अत्यधिक संदेह है कि कैसंड्रा का डिफ़ॉल्ट हैश फ़ंक्शन Suha का उपयोग नहीं करता है। – kokx
डेटा जो उनकी नहीं है अधिक समान वितरण मान कैसेंड्रा सकता है कैसे? उपयोगकर्ता हमेशा डेटा जो हैश फंक्शन के साथ अच्छी तरह से नहीं चलता है लिख सकते हैं। – eshalev