U+FFFD "यूनिकोड प्रतिस्थापन चरित्र" है:
“
यह प्रतीक को बदल दिया गया है , जिसका उपयोग तब किया जाता है जब आप जिस डेटा को पढ़ने का प्रयास करते हैं वह एन्कोडिंग के लिए अमान्य है जिसका प्रयोग बाइनरी डेटा को टेक्स्ट में बदलने के लिए किया जा रहा है।
उदाहरण के लिए, यदि आप किसी फ़ाइल बाहर ISO-8859-1 का उपयोग कर लिखते हैं, लेकिन फिर कोशिश करने के लिए पढ़ इसे प्रयोग UTF-8 है, तो आप आसानी से कुछ बाइट दृश्यों जो केवल वैध UTF नहीं हैं के साथ समाप्त कर सकता है -8। प्रत्येक अमान्य बाइट का अनुवाद (डिफ़ॉल्ट रूप से) यू + एफएफएफडी में किया जाएगा।
असल में, आपको दूसरे तर्क के रूप में File.ReadAllLines
पर सही एन्कोडिंग प्रदान करने की आवश्यकता है। इसका मतलब है कि आपको पहले फ़ाइल के एन्कोडिंग को जानना होगा।
स्रोत
2013-02-22 10:48:18
टेक्स्ट फ़ाइल का उपयोग करके एन्कोडिंग क्या है? एएनएसआई? ASCII? UTF8? UTF16? –
समस्या केवल एएनएसआई में आती है .... बाकी चीजें सही ढंग से काम कर रही हैं, यह इसे बदलती है - "- –
बस उन लोगों को जो शायद नहीं जानते। '(Char) 65533' को यू + एफएफएफडी भी कहा जाता है और यह एक प्रतिस्थापन चरित्र है। जब डेटा परिवर्तित किया जाता है तो यह अक्सर उत्सर्जित होता है, या जब एन्कोडिंग में कनवर्ट करने के लिए सही वर्ण का प्रतिनिधित्व नहीं किया जा सकता है। [विकिपीडिया] देखें (http://en.wikipedia.org/wiki/Specials_ (यूनिकोड_ब्लॉक) #Replacement_character)। –