मुझे ऑनलाइन अंग्रेजी शब्दों के बहुमत की एक सूची मिली, लेकिन लाइन ब्रेक यूनिक्स-शैली (यूनिकोड में एन्कोडेड: यूटीएफ -8) के हैं। मैंने इसे इस वेबसाइट पर पाया: http://dreamsteep.com/projects/the-english-open-word-list.htmlमैं एलएफ को सीआरएलएफ में कैसे परिवर्तित करूं?
मैं लाइन ब्रेक को सीआरएलएफ में कैसे परिवर्तित करूं ताकि मैं उन पर फिर से चालू हो सकूं? प्रोग्राम में मैं उनका उपयोग करूँगा फ़ाइल में प्रत्येक पंक्ति के माध्यम से चला जाता है, इसलिए शब्दों को प्रति पंक्ति एक होना चाहिए।
इस फ़ाइल के एक हिस्से को है: bitbackbitebackbiterbackbitersbackbitesbackbitingbackbittenbackboard
यह होना चाहिए:
bit
backbite
backbiter
backbiters
backbites
backbiting
backbitten
backboard
मैं कैसे इस प्रकार करने के लिए अपने फ़ाइलों को कनवर्ट कर सकते हैं? नोट: यह 26 फाइलें (प्रति पत्र एक) 80,000 शब्दों या कुल में है (इसलिए कार्यक्रम बहुत तेज़ होना चाहिए)।
मुझे नहीं पता कि कहां से शुरू करना है क्योंकि मैंने कभी यूनिकोड के साथ काम नहीं किया है। अग्रिम में धन्यवाद!
मेरी कोड में पैरामीटर (के रूप में सुझाव) के रूप में rU
का उपयोग करना, इस के साथ:
Traceback (most recent call last):
File "<pyshell#5>", line 1, in <module>
addWords('B Words')
File "D:\my_stuff\Google Drive\documents\SCHOOL\Programming\Python\Programming Class\hangman.py", line 138, in addWords
for line in my_file:
File "C:\Python3.3\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 7488: character maps to <undefined>
किसी को भी इस के साथ मेरी मदद कर सकते:
with open(my_file_name, 'rU') as my_file:
for line in my_file:
new_words.append(str(line))
my_file.close()
मैं इस त्रुटि मिलती है?
आप संभवतः यह http://stackoverflow.com/questions/3891076/how-to-convert-windows-end-of-line-in-unix-end-of-line-cr-lf-to- lf सहायक – dmi3y
क्या आप अपना प्रोग्राम दोनों प्रकार की लाइन समाप्त करने में सक्षम नहीं हो सकते हैं? –
@JamesMcLaughlin मेरे पास पहले से ही शब्दों की एक सूची है। इसके अलावा, मैंने कभी भी यूनिकोड (जैसा कि बताया गया है) का उपयोग नहीं किया है, इसलिए मुझे नहीं पता कि उन प्रकार के अंत को कैसे संभालना है। –