मैं निम्नलिखित अजगर कोड html पृष्ठ डाउनलोड करने के लिए प्रयोग किया है: एक पेज जैसे this one लिएurllib2 अजगर (स्थानांतरण-एन्कोडिंग: chunked)
response = urllib2.urlopen(current_URL)
msg = response.read()
print msg
, यह बिना किसी त्रुटि के यूआरएल को खोलता है, लेकिन फिर का ही हिस्सा प्रिंट एचटीएमएल पेज!
निम्न पंक्तियों में आप HTML-पृष्ठ के http शीर्षलेख पा सकते हैं। मुझे लगता है कि समस्या "स्थानांतरण-एन्कोडिंग: खंडित" के कारण है।
ऐसा लगता है कि urllib2 केवल पहला खंड देता है! मुझे शेष हिस्सों को पढ़ने में कठिनाइयां हैं। मैं शेष हिस्सों को कैसे पढ़ सकता हूं?
Server: nginx/1.0.5
Date: Wed, 27 Feb 2013 14:41:28 GMT
Content-Type: text/html;charset=UTF-8
Transfer-Encoding: chunked
Connection: close
Set-Cookie: route=c65b16937621878dd49065d7d58047b2; Path=/
Set-Cookie: JSESSIONID=EE18E813EE464664EA64086D5AE9A290.tpdjo13v_3; Path=/
Pragma: No-cache
Cache-Control: no-cache,no-store,max-age=0
Expires: Thu, 01 Jan 1970 00:00:00 GMT
Vary: Accept-Encoding
Content-Language: fr