मान लीजिए मैं एक टैब सीमांकित इस प्रकार फ़ॉर्मेट उपयोगकर्ता गतिविधि डेटा वाली फ़ाइल है:Hadoop - समग्र कुंजी
timestamp user_id page_id action_id
मैं प्रत्येक पृष्ठ पर उपयोगकर्ता की गिनती के लिए एक Hadoop काम लिखना चाहते हैं, तो आउटपुट फ़ाइल दिखना चाहिए इस तरह:
user_id page_id number_of_actions
मुझे यहां समग्र कुंजी की तरह कुछ चाहिए - इसमें user_id और page_id होगा। क्या हडूप के साथ ऐसा करने का कोई सामान्य तरीका है? मुझे कुछ भी उपयोगी नहीं मिला। अब तक मैं इस तरह की कुंजी मैपर में उत्सर्जित कर रहा हूं:
context.write(new Text(user_id + "\t" + page_id), one);
यह काम करता है, लेकिन मुझे लगता है कि यह सबसे अच्छा समाधान नहीं है।
तुलनात्मकता वास्तव में इस उपयोग के मामले के लिए आसान बनाता है। धन्यवाद –