मैं एक वेब पेज पढ़ने के लिए एक स्क्रिप्ट लिख रहा हूं, और एक निश्चित मानदंड से मेल खाने वाले लिंक का डेटाबेस बना रहा हूं। अभी मैं lxml और कैसे समझ एचटीएमएल से सभी <a href>
के हड़पने के लिए साथ अटक कर रहा हूँ ...वेब पेज पर सभी लिंक खोजने के लिए पायथन एलएक्सएमएल/सुंदर सूप
result = self._openurl(self.mainurl)
content = result.read()
html = lxml.html.fromstring(content)
print lxml.html.find_rel_links(html,'href')
इस दर्जनों बार कहा गया है और अच्छा जवाब है, जैसे है: http://stackoverflow.com/questions/1080411/retrieve-links- से-वेब-पेज-उपयोग-पायथन-और-सुंदर-सूप –