का उपयोग करें मैं^ए को आउटपुट फ़ाइलों को कम करने में कुंजी और मान के बीच विभाजक के रूप में उपयोग करने की कोशिश कर रहा हूं। मैंने पाया config सेटिंग "mapred.textoutputformat.separator" मैं क्या चाहते है कि और यह सही ढंग से करने के लिए विभाजक "" स्विच:हडोप - textouputformat.separator ctrlA (^ ए)
conf.set("mapred.textoutputformat.separator", ",");
लेकिन यह^एक चरित्र को संभाल नहीं कर सकते हैं:
ERROR security.UserGroupInformation: PriviledgedActionException as:user (auth:SIMPLE) cause:org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.lang.RuntimeException: org.xml.sax.SAXParseException; lineNumber: 68; columnNumber: 94; Character reference "&#
मैं इस टिकट https://issues.apache.org/jira/browse/HADOOP-7542 पाया और देखें कि वे त्रि:
conf.set("mapred.textoutputformat.separator", "\u0001");
इस त्रुटि फेंकता इसे ठीक करने के लिए एड लेकिन XML1.1 चिंताओं के कारण पैच को वापस कर दिया।
तो मैं सोच रहा हूं कि अगर किसी ने आसानी से अलग करने के लिए विभाजक को^ए (बहुत आम लगता है) को सेट किया है। या अगर मुझे बस बसने और टैब विभाजक का उपयोग करना चाहिए।
धन्यवाद!
मैं CentOS 6.2
उपरोक्त, यह एक वैध प्रश्न है, इसे प्रोत्साहित किया जाना चाहिए। – Siddharth