मैं अपने सभी reducers को एक विशिष्ट रिकॉर्ड कैसे भेज सकता हूं? मुझे पार्टिशनर क्लास पता है और यह क्या करता है, लेकिन मुझे यह सुनिश्चित करने का कोई आसान तरीका नहीं दिख रहा है कि रिकॉर्ड सभी रेड्यूसर पर
मैं Hadoop का उपयोग कर रहा किए जाने वाले बहुत असमान वितरण का विश्लेषण करने के लिए। कुछ कुंजियों में हजारों मूल्य होते हैं, लेकिन अधिकांश में केवल एक ही होता है। उदाहरण के लिए, आईपी पते से जुड़े नेटवर्