में वर्णों से बच निकले मेरे पास एक सूची है जिसमें उनसे बच निकले वर्णों वाले यूआरएल हैं। उन अक्षरों urllib2.urlopen
द्वारा निर्धारित किया गया है, जब यह html पृष्ठ ठीक हैडीकोड यूआरएल
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=edit
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&action=history
http://www.sample1webpage.com/index.php?title=%E9%A6%96%E9%A1%B5&variant=zh
वहाँ अजगर में उनके नहीं छोड़ा जाएगा फार्म के लिए उन्हें वापस बदलने के लिए कोई तरीका है?
पी.एस .: यूआरएल utf-8
गंदें शब्द बोलना शो के रूप में मैं sample.com/index.php?title=\xe9\xa6\x96\xe9\xa1 ऊपर कहा \ xb5 और action = edi ... शायद मैंने इस मामले में खुद को बहुत अच्छी तरह से समझाया नहीं है ... लेकिन यूआरएल एक चीनी है और मैं इसके मूल चार को डीकोड करना चाहता हूं, न कि एक निर्विवाद एक – dyoser
@dyoser आपको इसे रखना होगा आपके प्रश्न में –
@ root45 यह एक उत्तर के लिए एक टिप्पणी है ... तो यह ठीक है यहाँ अच्छा है। सराहना करने के लिए धन्यवाद। – dyoser