मुझे आश्चर्य है कि यूटीएफ -8 में वर्णों का अनुवाद कैसे करना संभव है जावास्क्रिप्ट का उपयोग कर निकटतम ASCII समकक्ष, जैसे Iconv PHP में करता है।
उदाहरण: क्योंकि एक) यह पात्रों का एक पूरा सेट है, जो बहुत काम है की आवश्यकता है और
ü, यू हो जाता है
ओ ओ
हो जाता है मैं नहीं बल्कि एक की जगह का उपयोग नहीं होता है ख) मुझे पात्रों का पूरा सेट प्राप्त करना मुश्किल होगा, और अगर मैं एक या दो खो रहा हूं तो मैं कभी भी निश्चित नहीं रहूंगा।
जब आप कहते हैं कि "UTF-8", आप * वास्तव में * मतलब यूटीएफ -8? जैसे, "पात्रों" की एक स्ट्रिंग जिसका तत्व वास्तव में बिल्कुल अक्षर नहीं हैं, लेकिन बस यूटीएफ -8 कोड-इकाइयों को 16 बिट्स में पदोन्नत किया गया है? या आपका मतलब है "यूनिकोड", यानी, एक सामान्य जावास्क्रिप्ट यूटीएफ -16 स्ट्रिंग? – ruakh
यह संभव है, लेकिन यूनिकोड मानों से मानचित्र होने के अलावा, जो भी ASCII "समकक्ष" (या कोई) उचित होने के बारे में सोचने के अलावा इसे करने के लिए कोई एल्गोरिदमिक तरीका नहीं है। ध्यान दें कि एक यूटीएफ -8 स्ट्रिंग में * कई * बहुत अलग वर्णमाला के लिए कोड पॉइंट शामिल हो सकते हैं। – Pointy
इसके लिए शब्द 'ट्रांसक्रिप्शन' या 'लिप्यंतरण' है, शायद वहां कुछ पुस्तकालय हैं। – Kapep