मैं मैपआर को थोड़ा अलग तरीके से परिभाषित करता हूं। यह एचडीएफएस का उपयोग नहीं करता है, लेकिन इसके बजाय एनएफएस इंटरफ़ेस के साथ अपनी वितरित फ़ाइल सिस्टम प्रदान करता है। जो, साथ ही एचडीएफएस स्थानीय एफएस पर आधारित है।
मुख्य अंतर इस तथ्य से आ रहे हैं कि एचडीएफएस पॉज़िक्स और अन्य डिज़ाइन विकल्प नहीं है।
1. मैडआर के दौरान एचडीएफएस उत्परिवर्तनीय नहीं है। इसे लाभ के रूप में देखा जा सकता है, खासकर यदि आपको इसकी आवश्यकता है।
2. मैडआर है, जबकि एचडीएफएस आरोही नहीं है। आप लिनक्स एफएस के साथ काम कर रहे किसी मौजूदा उपकरण का उपयोग कर सकते हैं।
पॉज़िक्स से संबंधित नहीं: मानचित्रआर में छोटे ब्लॉक आकार हैं और विफलता का एक बिंदु नहीं है (NameNode)। मानचित्रआर में बहुआयामी प्रतिकृति है।
अंधेरे पक्ष को भी देखने देता है: ए) म्यूटेबल डेटा (म्यूटेबल एचडीएफएस के बजाय) सिस्टम को और अधिक जटिल बनाता है।
बी) यह विशाल क्लस्टर पर काम करने के लिए ज्ञात नहीं है (कम से कम मेरे लिए)। (मैंने लगभग सौ नोड्स सुना)।
सी) आर्किटेक्चर बिंदु (छोटे ब्लॉक वाले) से मुझे यकीन नहीं है कि डेटा डेटा कितना अच्छा हो सकता है।
स्रोत
2013-02-26 06:43:29
डेविड की अंधेरे-पक्ष टिप्पणियों के संबंध में, (ए) उत्परिवर्तन उपयोगकर्ता के लिए चीजों को अधिक सरल बनाता है, (बी) यह बड़े समूहों पर काम करता है ...हाल के विश्व प्रकार के रिकॉर्ड देखें, (सी) छोटे ब्लॉक इलाके के लिए मुद्दा नहीं हैं; मैपआर डिस्क यूनिट (छोटे ब्लॉक), क्लस्टर स्ट्रिपिंग यूनिट (जैसे हडोप ब्लॉक 100 के एमबी) की अवधारणाओं को अलग करता है और स्थिर स्केलिंग (हैडॉप्स डिफ़ॉल्ट 64 एमबी के बजाय 30 जीबी)। –
टेड - कृपया सॉर्ट रिकॉर्ड –
डेव के लिए एक लिंक प्रदान करें, श्रीवास पहले ही लिंक प्रदान कर चुके हैं। देखें http://www.mapr.com/blog/hadoop-minutesort-record –