में कैसे पढ़ा जाए, मैं एक संपूर्ण वेब पेज पढ़ने और इसे एक चर के लिए असाइन करने की कोशिश कर रहा हूं, लेकिन मुझे ऐसा करने में परेशानी हो रही है। वेरिएबल केवल पृष्ठ स्रोत की पहली 512 या तो लाइनों को पकड़ने में सक्षम है।एक संपूर्ण वेब पेज को एक चर
मैंने स्क्रीन पर स्रोत की सभी पंक्तियों को मुद्रित करने के लिए रीडलाइन() का उपयोग करने की कोशिश की, और इसने मुझे पूरी तरह से स्रोत दिया, लेकिन मुझे इसे रेगेक्स के साथ पार्स करने में सक्षम होना चाहिए, इसलिए मुझे इसे स्टोर करने की आवश्यकता है किसी भी तरह एक चर में। मदद?
data = urllib2.urlopen(url)
print data
केवल मुझे स्रोत के लगभग 1/3 देता है।
data = urllib2.urlopen(url)
for lines in data.readlines()
print lines
यह मुझे पूरा स्रोत देता है।
जैसा कि मैंने कहा, मुझे स्ट्रिंग के साथ स्ट्रिंग को पार्स करने में सक्षम होना चाहिए, लेकिन मुझे जिस भाग की आवश्यकता है वह पहले 1/3 में नहीं है, मैं अपने चर में स्टोर करने में सक्षम हूं।
[डाउनलोड html पृष्ठ और उसकी सामग्री] के संभावित डुप्लिकेट (http://stackoverflow.com/questions/1825438/download-html-page-and-its-content) –