2011-03-15 13 views
9

वेबपैप (django) पर्यावरण में PostgreSQL के बजाय Greenplum का उपयोग करने के विरुद्ध और उसके विरुद्ध तर्क क्या हैं?ग्रीनप्लम बनाम पोस्टग्रेएसक्यूएल

मेरी आंत प्रतिक्रिया PostgreSQL के ओपन-सोर्स दृष्टिकोण और विशाल ज्ञानबेस को प्राथमिकता देना है।

मेरी कॉन्फ़िगरेशन (हालांकि मुझे किसी अन्य कॉन्फ़िगरेशन के बारे में सुनना अच्छा लगेगा) एक मध्यम आकार का व्यवसाय है जिसमें 2 वेब सर्वर और (फिलहाल) 2 डेटाबेस सर्वर हैं।

विपरीत विपरीत क्षेत्र बाइनरी data crunching हैं, replication में नोड्स की संख्या और मेरा व्यक्तिगत पसंदीदा: communitiy support और कुशल इंजीनियर समर्थन।

PostgreSQL के बजाय ग्रीनप्लम का उपयोग करने के पेशेवर और विपक्ष क्या हैं?

+0

क्या यह 'समुदाय विकी' होना चाहिए? –

+1

ग्रीनप्लम अब खुला स्रोत है: http://greenplum.org/ –

उत्तर

9

मुझे आपके द्वारा भेजे गए लिंक को जल्दी से छोड़ने के अलावा, ग्रीनप्लम के बारे में बहुत कुछ पता नहीं है। डेटा वेयरहाउस एक लेनदेन संबंधी परिचालन डेटा स्टोर के समान नहीं है। पूर्व विज्ञापन प्रश्नों, सांख्यिकीय विश्लेषण, आयामी विश्लेषण, पढ़ने के लिए ऐतिहासिक डेटा तक पहुंच के लिए है। उत्तरार्द्ध वास्तविक समय के लिए है, परिचालन डेटा को पढ़ें/लिखें। वे मानार्थ हैं।

मुझे लगता है कि आप PostgreSQL चाहते हैं।

कौन आपको ग्रीनप्लम को दबा रहा है और क्यों? यदि इसे एक विकल्प के रूप में प्रस्तुत किया जा रहा है, तो मैं गहरी खुदाई करूंगा और तर्क को दोबारा दूंगा।

+6

आप सही हैं कि डेटा वेयरहाउस एक लेनदेन/परिचालन डेटा स्टोर के समान नहीं है, लेकिन ग्रीनप्लम दोनों होता है। ग्रीनप्लम की प्राथमिक विशेषता यह है कि यह विभिन्न भौतिक सर्वरों पर PostgreSQL के एक मालिकाना संस्करण (मालिकाना संस्करण) के कई उदाहरणों पर भंडारण और गणना दोनों समानांतर करता है। यह लेनदेन और विश्लेषणात्मक वर्कलोड दोनों के लिए लाभ प्रदान करता है। जीपी में डाटा वेयरहाउसिंग (अर्थात् कॉलमर स्टोरेज और संपीड़न) के लिए अतिरिक्त सुविधाएं भी हैं, लेकिन साथ ही लेनदेन प्रक्रिया को एक साथ संभालने के लिए डिज़ाइन की गई है। हालांकि, यह पोस्टग्रेएसक्यूएल से भी बदतर हो सकता है। – goodside

2

मुझे लगता है कि ग्रीनप्लम समांतर प्रसंस्करण का बेहतर लाभ लेता है। यह PostgreSQL पर आधारित है, हालांकि।

ग्रीनप्लम में free community edition है। आप हमेशा अपने पर्यावरण में डाउनलोड और परीक्षण कर सकते हैं।

3

चूंकि ग्रीनप्लम समांतर प्रसंस्करण का उपयोग करता है, इसलिए बहुत सारे छोटे पढ़ने वाले प्रश्नों के साथ ओवरहेड होगा क्योंकि मास्टर नोड को इन सभी प्रश्नों के उत्तर प्राप्त करने के लिए अंतर्निहित डेटा नोड्स के साथ संवाद करने की आवश्यकता है। मिलीसेकंड लेने वाली एक क्वेरी के लिए, ग्रीनप्लम के लिए तीव्रता के धीमे प्रदर्शन के आदेश की अपेक्षा करें।

3

यदि आप पोस्टग्रेएसक्यूएल-आधारित डेटा वेयरहाउसिंग समाधान की तलाश में हैं, तो मैं ग्रिडएसक्यूएल को भी देखूंगा। यह एकाधिक PostgreSQL उदाहरणों पर समांतरता परत है, और यह नि: शुल्क और मुक्त स्रोत है।

अन्य टिप्पणियों में उल्लिखित की तरह, यह कई छोटे मिलीसेकंड प्रश्नों के लिए अच्छा प्रदर्शन नहीं करेगा, लेकिन लंबे समय तक चलने वाले प्रश्नों के लिए आपको बहुत मदद करेगा। ग्रिडएसक्यूएल में डीडब्लू ऑप्टिमाइज़ेशन भी शामिल नहीं होंगे जैसे कि ग्रीनप्लम में कॉलमर स्टोरेज है, लेकिन आप अपने क्वेरी परिणामों को तेज़ी से प्राप्त करने के लिए समानांतरता के साथ संयुक्त बाधा बहिष्करण विभाजन (उदा: दिनांक सीमा द्वारा उप-वर्ग) का लाभ उठा सकते हैं।

आप इसे एक बहु-कोर सर्वर पर भी उपयोग कर सकते हैं, क्योंकि PostgreSQL केवल एक क्वेरी को प्रोसेस करते समय केवल एक कोर का उपयोग करेगा।

1

यदि कोई डेटा क्रंचिंग एक घंटे से अधिक समय लेता है, तो आपको जो भी कोर जोड़ता है, उसके लिए आपको रैखिक प्रदर्शन बूस्ट मिल जाएगा। यह वास्तव में किसी भी चीज के प्रयास के लायक नहीं है जिसके माध्यम से क्रंच करने में कम समय लगता है।

7

ग्रीनप्लम PostgreSQL का एक एमपीपी अनुकूलन है। यह डेटा के बड़े सेट पर गोदाम और/या विश्लेषण के लिए अनुकूलित है और लेनदेन संबंधी वातावरण में यह अच्छा प्रदर्शन नहीं करेगा। यदि आपको एक बड़े डीडब्ल्यू पर्यावरण की आवश्यकता है, तो ग्रीनप्लम देखें। यदि आपको OLTP या छोटे डीबी आकार (10TB के तहत) की आवश्यकता है तो PostgreSQL देखें।

3

ग्रीनप्लम एक एमपीपी विश्लेषणात्मक (ओलाप) डीबीएमएस है। PostgreSQL एक ओएलटीपी डीबीएमएस है। और सामान्य रूप से, बाजार पर एक भी समाधान नहीं है जो एक ही समय में ओलाप और ओएलटीपी दोनों में अच्छा हो सकता है, आप इस पर अपने विचार पा सकते हैं here

वेब ऐप बैकएंड हमेशा OLTP वर्कलोड बनाएगा। लेन-देन प्रसंस्करण के लिए ग्रीनप्लम का एक बड़ा ओवरहेड है क्योंकि यह एक वितरित प्रणाली है, इसलिए यह आपको 500-600 से अधिक टीपीएस देने की अपेक्षा न करें। इसके विपरीत पोस्टग्रेस सही ट्यूनिंग के साथ सैकड़ों हजारों टीपीएस जा सकते हैं।

इसके विपरीत, जब आपको ओलाप वर्कलोड की आवश्यकता होती है, तो पोस्टग्रेर्स आपको केवल एक मेजबान प्रसंस्करण की पेशकश कर सकता है, गतिशील विभाजन उन्मूलन के साथ कोई विभाजन नहीं, कोई संपीड़न नहीं, कोई कॉलमर स्टोर नहीं है। जबकि ग्रीनप्लम क्लस्टर पर समानांतर में आपके डेटा को कम करने में सक्षम होगा। , उच्च लेन-देन संबंधी काम का बोझ के लिए OLTP समाधान का उपयोग ईटीएल/ईएलटी साथ DWH के लिए डेटा निकालने, और फिर उस पर

प्रश्नों क्रंचिंग जटिल डेटा चलाने -

तो समाधान आप देख रहे हैं एक विशिष्ट डाटा वेयरहाउस मामला है फिलहाल PostgreSQL और Greenplum दोनों खुले स्रोत उत्पाद हैं, इसलिए आप उनमें से किसी को भी चुनने के लिए स्वतंत्र हैं, लेकिन कारण PostgreSQL समुदाय बड़ा एटीएम