मेरे काम में हम एक विशाल अनुप्रयोग बना रहे हैं जो अरबों ट्रिपल का उपयोग करेगा, इन ट्रिपल को स्टोर करने के लिए आवश्यक स्थान को ऑप्टिमाइज़ करने के लिए, मैं उन्हें प्रतिनिधित्व करने के लिए एक अलग तरीके से खोज रहा हूं, किसी भी तरह से अधिक आर्थिक स्वागत है। धन्यवादक्या कोई वेब अर्थशास्त्रीय ढांचा है जो त्रि-नोड संरचना की तरह ट्रिपल का प्रतिनिधित्व नहीं करता है?
क्या कोई वेब अर्थशास्त्रीय ढांचा है जो त्रि-नोड संरचना की तरह ट्रिपल का प्रतिनिधित्व नहीं करता है?
उत्तर
ग्राफ स्टोरेज सिस्टम की एक पूरी कक्षा भी है जो चीजों को neo4j जैसे ट्रिपल के रूप में स्टोर नहीं करती है। लेकिन, मैं ट्रिपल स्टोर्स को सिर्फ इसलिए नहीं रोकूंगा क्योंकि वे चीजों को ट्रिपल के रूप में स्टोर करते हैं ;-) आज के कई मौजूदा समाधान पहले से ही अरबों ट्रिपल स्टोर करते हैं, इसलिए यह पूर्ववत नहीं है (हालांकि आपको उन चीज़ों से 1 या 2 ऑर्डर मिलता है कठोर)। मैंने व्यक्तिगत रूप से 1 अरब से अधिक के साथ एक एलेग्रोग्राफ स्टोर भर दिया है। http://www.semanticoverflow.com/questions/3332/scalable-owl-rdf-database
मुझे नहीं लगता कि अंतरिक्ष Triples के अरबों स्टोर करने के लिए आवश्यक वास्तविक अंतरिक्ष एक SQL डेटाबेस में पंक्तियों के अरबों स्टोर करने के लिए आवश्यकता से किसी भी बदतर है है:
इस सूत्र देखें।
सामान्य दृष्टिकोण यह है कि अधिकांश सिस्टम यह लेते हैं कि देशी स्टोर/एसक्यूएल आधारित नोड्स को आईडी असाइन करना है और प्रत्येक ट्रिपल को केवल 3 नोड आईडी के रूप में स्टोर करना है। नोड आईडी पीढ़ी की अच्छी पसंद और नोड आईडी और नोड मूल्य के बीच एक कुशल सूचकांक को देखते हुए आप आसानी से स्टोर्स बना सकते हैं जो बड़े पैमाने पर स्केल करते हैं।
एक और अनुकूलन के रूप में कुछ स्टोर इस तरह से नोड आईडी उत्पन्न करते हैं कि साधारण मूल्य प्रकार (जैसे पूर्णांक, बूलियन, दिनांक समय इत्यादि) उनके मूल्य को सीधे नोड आईडी में एन्कोड किया गया है, इसलिए लुकअप करने की कोई आवश्यकता नहीं है आईडी से मूल्य (या ऐसे डेटा को सम्मिलित करते समय इसके विपरीत)
जैसा कि रॉब कहते हैं, लगभग सभी स्टोर्स आंतरिक मान/नोड-आईडी को ट्रिपल के तत्वों से जोड़ते हैं। ऐसा कहा जा रहा है कि, तीन तिहाई दुकानों के लिए बहुत सी जगह लुकअप करने के लिए आवश्यक विभिन्न इंडेक्स द्वारा ली जाती है। एक रिलेशनल डेटाबेस में आप जिस डेटामैडेल का उपयोग कर रहे हैं उसके आधार पर आप आसानी से इंडेक्स की संख्या को कम कर सकते हैं। ट्रिपल स्टोर्स में यह बहुत कठिन होता है, और स्टोर मूल रूप से एक बड़ी संख्या (6+) इंडेक्स को विभिन्न तरीकों से बनाते हैं जो ट्रिपल के तत्वों का आदेश दिया जा सकता है।
semanticoverflow.com पर विचार करने पर विचार करें – harschware