hadoop

    16गर्मी

    5उत्तर

    जावा में एक स्टोकेस्टिक सिमुलेशन, जो डिस्क पर कुछ CSV फ़ाइलों से डेटा लोड (100 एमबी के बारे में कुल मात्रा) और एक अन्य आउटपुट फ़ाइल के लिए परिणाम लिखते हैं (ज्यादा नहीं डेटा, बस एक बूलियन और कुछ संख्य

    7गर्मी

    3उत्तर

    में अलग आउटपुट फ़ाइलों को उत्पन्न करना केवल एक मैपर (एक पायथन स्क्रिप्ट) और कोई रेड्यूसर का उपयोग करके, आउटपुट की लंबी फाइलों के बजाय आउटपुट की प्रत्येक पंक्ति के लिए, फ़ाइल नाम के रूप में कुंजी के सा

    9गर्मी

    6उत्तर

    मैंने हाल ही में Hadoop के साथ एक खेल खेला था और मैपरेडस नौकरियों के शेड्यूलिंग, प्रबंधन और रिपोर्टिंग से प्रभावित था। ऐसा लगता है कि डेवलपर को अपनी नौकरियों के कार्यान्वयन पर ध्यान केंद्रित करने की इ

    20गर्मी

    4उत्तर

    किसी उपलब्ध विभिन्न Hadoop वितरण के बीच विभिन्न अंतर की रूपरेखा तैयार कर सकते हैं: क्लाउडेरा - http://www.cloudera.com/hadoop याहू - http://developer.yahoo.net/blogs/hadoop/ अपाचे Hadoop distro के रूप

    12गर्मी

    2उत्तर

    में उपलब्ध reducers मुझे उम्मीद है कि मैं इसे सही तरीके से पूछ रहा हूँ। मैं लोचदार MapReduce के आसपास अपना रास्ता सीख रहा हूं और मैंने "कुल" reducer के कई संदर्भ देखे हैं जिनका उपयोग "स्ट्रीमिंग" नौकर

    25गर्मी

    5उत्तर

    अतीत में मैं MySQL पर चल रहे ओलाप क्यूब्स का उपयोग करके वेबएनालिटिक्स का निर्माण करता था। अब एक ओलाप क्यूब जिस तरह से मैंने इसका इस्तेमाल किया है वह बस एक बड़ी मेज है (ठीक है, यह उससे थोड़ा अधिक स्मार

    6गर्मी

    1उत्तर

    से हाडोप मैप्रिडस स्ट्रीमिंग मैं एक हैडोप (0.20.1) मैप्रिडस जॉब का निर्माण कर रहा हूं जो एचबीएस (0.20.1) का उपयोग डेटा स्रोत और डेटा सिंक दोनों के रूप में करता है। मैं पाइथन में नौकरी लिखना चाहता हूं

    51गर्मी

    3उत्तर

    मैं हैडोप का उपयोग कर एक प्रोजेक्ट पर काम कर रहा हूं और ऐसा लगता है कि यह मूल रूप से जावा को शामिल करता है और पायथन के लिए स्ट्रीमिंग समर्थन प्रदान करता है। क्या एक दूसरे को चुनने के लिए एक महत्वपूर्ण

    5गर्मी

    2उत्तर

    क्या किसी को CloudStore और HDFS दोनों के साथ काम करने की कोई परिचितता है। मुझे यह देखने में दिलचस्पी है कि क्लाउडस्टोर को कितना दूर किया गया है और उत्पादन में इसका कितना उपयोग किया गया है। क्लाउडस्टोर

    8गर्मी

    3उत्तर

    Task Side-Effect Files हडोप ट्यूटोरियल के अनुभाग के लिए कार्य प्रयास आईडी प्राप्त करें, कार्य के "प्रयास" का उपयोग एक अद्वितीय नाम के रूप में किया गया है। मैं अपने मैपर या reducer में यह प्रयास आईडी क