इस एचटीएमएलXPath का उपयोग कर HTML तत्व की टेक्स्ट सामग्री प्राप्त करें?
<div>
<p>
<span class="abc">Monitor</span> <b>$300</b>
</p>
<a href="/add">Add to cart</a>
</div>
<div>
<p>
<span class="abc">Keyboard</span> $20
</p>
<a href="/add">Add to cart</a>
</div>
देखें xpath का उपयोग करते हुए मैं Monitor $300
और Keyboard $20
पार्स करने के लिए चाहता हूँ। मैं इस xpath का उपयोग
//div[a[contains(., "Add to cart")]]/p/text()
लेकिन यह <span class="abc">Monitor</span> <b>$300</b>
चयन करता है। मुझे टैग नहीं चाहिए। मैं केवल पाठ कैसे प्राप्त करूं?
//div[a[contains(., "Add to cart")]]/p//text()
नोट p
और text()
वहाँ के बीच डबल स्लैश:
'टेक्स्ट() 'तत्वों का चयन कभी नहीं करना चाहिए। आप किस एक्सएमएल पार्सर का उपयोग कर रहे हैं? – choroba
@choroba 'scrapy.selector.lxmlsel.HtmlXPathSelector' –
आप मूल्य का उपयोग कैसे करते हैं? डीओएम स्तर 3 शब्द में आप 'पी' तत्वों का चयन करेंगे उदा। '// div [a [इसमें (।," कार्ट में जोड़ें ")]]/p' और फिर सादे पाठ सामग्री प्राप्त करने के लिए' textContent' प्रॉपर्टी तक पहुंचें। –