मेरे पास एक टेक्स्ट है जिसमें "\ xaf", "\ xbe" जैसे वर्ण हैं, जैसा कि मैं इसे this question से समझता हूं, ASCII एन्कोडेड वर्ण हैं।पायथन में xXY एन्कोडेड वर्णों को यूटीएफ -8 में कैसे परिवर्तित करें?
मैं उन्हें पायथन में उनके यूटीएफ -8 समकक्षों में परिवर्तित करना चाहता हूं। सामान्य string.encode("utf-8")
UnicodeDecodeError
फेंकता है। क्या कोई बेहतर तरीका है, उदाहरण के लिए, codecs
मानक लाइब्रेरी के साथ?
नमूना 200 characters here।
आपका नमूना शामिल नहीं है किसी भी '\ xaf' या पसन्द। क्या आपके पास ऐसे पात्रों के साथ कोई नमूने हैं? – dkarp
आपका नमूना डेटा * मान्य यूटीएफ -8 है। "रिकॉर्ड विभाजक" और "इकाई विभाजक" नियंत्रण वर्णों के साथ। – dan04
'enca' (http://linux.die.net/man/1/enca) के अनुसार यह यूटीएफ -8 है" गैर-पाठ डेटा से घिरा हुआ/इंटरमीक्स "। –