2011-08-18 22 views
8

Wikipedia article on UTF-8 पढ़ना, मैं शब्द के बारे में सोच रहा हूं। इस शब्द का प्रयोग कई बार किया जाता है लेकिन लेख इसके अर्थ के लिए परिभाषा या संदर्भ प्रदान नहीं करता है।वास्तव में एक अतिव्यापी रूप/एन्कोडिंग क्या है?

मैं जानना चाहता हूं कि कोई व्यक्ति शब्द और उसके उद्देश्य को समझा सकता है या नहीं।

उत्तर

11

यह एक कोड बिंदु का एक एन्कोडिंग है जो इसकी आवश्यकता से अधिक कोड इकाइयां लेता है।

उदाहरण के लिए, यू +0020 को यूटीएफ -8 में एकल बाइट 0x20 द्वारा दर्शाया गया है। यदि आप सामान्य फैशन में दो बाइट 0xc0 0xa0 को डीकोड करते हैं, तो भी आप यू +0020 पर वापस आ जाएंगे, लेकिन यह एक अवैध प्रतिनिधित्व है।

Unicode Corrigendum #1 में अधिक जानकारी है, खासकर तालिका 3.1 बी के आसपास।

2

यूटीएफ -8 सैद्धांतिक रूप से पात्रों के विभिन्न प्रतिनिधित्वों की अनुमति देता है जिनमें एक छोटा सा भी होता है। उदाहरण के लिए, आप एमएसबी को शून्य पर सेट करके दो बाइट्स में एक ASCII वर्ण को एन्कोड कर सकते हैं। यूटीएफ -8 विनिर्देश स्पष्ट रूप से इसे मना करता है।

+0

भयानक पन। नीचे मतदान किया। – Computer

+0

@ कंप्यूटर: ओ.ओ मुझे क्या पल याद आया? – Joey

+0

आपने कहा मना कर दिया! – Computer