के साथ एक मैप्रिडस जॉब मैं मानचित्र के साथ एवरो का उपयोग करने के बारे में बहुत उलझन में हूं और अनुसरण करने के लिए अच्छे ट्यूटोरियल नहीं ढूंढ पा रहा हूं।सादा पाठ इनपुट और एवरो आउटपुट
ऐसा लगता है कि AvroJob और AvroMapper जैसी कक्षाएं समस्याओं के लिए तैयार हैं जब इनपुट और आउटपुट दोनों एरो डेटा फाइलें हैं। आपके इनपुट के बारे में क्या सादा पाठ है?
विशेष रूप से:
मेरे नक्शाकार इनपुट के रूप में LongWritable कुंजी और पाठ मान लेता है। यह टेक्स्ट कुंजी और MyAvroRecord मानों को उत्सर्जित करता है।
मेरा रेड्यूसर टेक्स्ट कुंजी और इनपुट के रूप में MyAvroRecords के इटरेटर लेता है, और टेक्स्ट कुंजी और MyAvroRecord मानों को उत्सर्जित करता है।
मैं आउटपुटफॉर्मैट कैसे प्राप्त करूं जो इन पाठ कुंजी और MyAvroRecord मानों को फ़ाइल में लिखने के लिए लिखेंगे?
चीयर्स, डेव
हाय डेव, मैं विपरीत में sth करने के लिए कोशिश कर रहा हूँ। मेरा इनपुट टेक्स्ट और आउटपुट जेनेरिक रिकॉर्ड है। मैं AvroJob के लिए एक एवरो इनपुट स्कीमा स्थापित करने का प्रयास करता हूं और फिर जेनरेट रिकॉर्ड की स्कीमा होने के लिए आउटपुट स्कीमा सेट करता हूं। लेकिन मुझे नहीं पता कि इनपुट स्कीमा को कैसे लपेटें ताकि एवरोबोब समझ सके कि यह सादा पाठ है। क्या मुझे बस setInputSchema() का उपयोग कुछ भी नहीं करना चाहिए? –