जब एक सादे-पाठ संपादक (जैसे TextMate या उदात्त पाठ 2) एक आम समस्या में बाहरी स्रोतों से पाठ चिपकाने कि विशेष वर्ण अक्सर साथ ही में चिपकाया जाता है। इनमें से कुछ वर्ण ठीक प्रस्तुत करते हैं, लेकिन स्रोत के आधार पर, कुछ सही ढंग से प्रदर्शित नहीं हो सकते हैं (आमतौर पर इसके आस-पास के बॉक्स के साथ एक प्रश्न चिह्न के रूप में दिख रहे हैं)।मैं अपने टेक्स्ट एडिटर में एक विशेष चरित्र का कैरेक्टर कोड कैसे ढूंढ सकता हूं?
विशेष वर्ण को देखते हुए (जैसे, 'या ♥) मैं UTF-8 वर्ण मेरी पाठ संपादक अंदर से उस चरित्र को प्रदर्शित करने के लिए प्रयोग किया जाता कोड निर्धारित कर सकते हैं, और:
तो यह वास्तव में 2 सवाल है/या उन पात्रों को उनके चरित्र कोड में परिवर्तित करें?
उन "अतिरिक्त विशेष" अक्षर है कि कचरा के रूप में आते हैं के लिए, वहाँ क्या एन्कोडिंग स्रोत पाठ में उस चरित्र को प्रदर्शित करने के लिए उपयोग किया गया यह पता लगाने की किसी भी तरह से है, और उन पात्रों किसी भी तरह बदला जा सकता है UTF-8 ?
आपको इस [ऑनलाइन उपकरण] (https://www.soscisurvey.de/tools/view-chars.php) अज्ञात पात्रों के साथ तार पेस्ट और उनके यूनिकोड संख्या को देखने के लिए उपयोग कर सकते हैं। – BurninLeo
एक बुनियादी सहायता के रूप में, मैं जो मैं अक्सर का उल्लेख रेंज विरासत 8 बिट अजगर, के लिए जाना जाता एनकोडिंग में 0x80-0xFF में सभी चरित्र कोड की एक टेबल बनाया है: https://cdn.rawgit.com/tripleee /8bit/master/encodings.html – tripleee