2011-09-20 8 views
8

मैं UTF-8 में एएनएसआई में इनकोडिंग एक HTML फ़ाइल परिवर्तित करना चाहते हैं, आरआर का उपयोग कर एक फ़ाइल एन्कोडिंग कनवर्ट करें? (UTF-8 के लिए एएनएसआई)

वहाँ एक उपकरण या टूल का एक संयोजन है का उपयोग करते हुए, कि यह काम कर सकते हैं?

धन्यवाद।

संपादित करें: ओ.के., मैंने अपनी समस्या को किसी अन्य को संकुचित कर दिया है। उसे यहां पुन: पोस्ट किया जाता है: Using "cat" to write non-English characters into a .html file (in R)

उत्तर

19

आप iconv का उपयोग कर सकते हैं:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html") 

tmp2.html utf-8 होना चाहिए। जून 2015 में हेनरिक द्वारा


संपादित करें:
विंडोज के लिए एक काम कर समाधान टिप्पणियों से आसवित इस प्रकार है:

writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), 
      file("tmp2.html", encoding="UTF-8")) 
+0

लेकिन एचटीएमएल हेडर के साथ क्या हुआ? या तो बदला नहीं जाना चाहिए? – Marek

+0

धन्यवाद Kohske, लेकिन यह मेरे लिए काम नहीं करता है। यह फ़ाइल में पाठ को रूपांतरित करेगा, लेकिन कुछ अजीब तरीके से, फाइल स्वयं ही नहीं। जब मैंने एन्कोडिंग को देखने के लिए नोटपैड ++ का उपयोग किया, तो यह अभी भी एएनएसआई है, और केवल नोटपैड ++ के माध्यम से मैं इसे यूटीएफ 8 में बदल सकता हूं (आपका कोड यह नहीं करेगा)। कोई सुझाव? :) –

+2

'से =" CP1252 "' को बदलने के बारे में कैसे? – kohske