के लिए पाइथन नियमित अभिव्यक्ति मैं विशिष्ट div टैग खींचने के लिए सुंदर सूप का उपयोग कर रहा हूं, और ऐसा लगता है कि मैं सरल स्ट्रिंग मिलान का उपयोग नहीं कर सकता।सुंदर सूप
पेज
<div class="comment comment-xxxx...">
के रूप में
<div class="comment form new"...>
का रूप है जो मैं अनदेखा करना चाहते में कुछ टैग, और भी कुछ टैग जहां एक्स की मनमानी लंबाई के एक पूर्णांक का प्रतिनिधित्व करते हैं , और अंडाकार सफेद रिक्त स्थान से अलग अन्य मूल्यों की मनमानी संख्या का प्रतिनिधित्व करता है (जिसे मैं चिंतित नहीं करता)। मैं सही रेगेक्स अभिव्यक्ति को नहीं समझ सकता, खासकर जब से मैंने कभी भी पाइथन की कक्षा का उपयोग नहीं किया है।
soup.find_all(class_="comment")
का उपयोग करते हुए सभी टैग शब्द टिप्पणी के साथ शुरू पाता है। मैं
soup.find_all(class_=re.compile(r'(comment)()(comment)'))
soup.find_all(class_=re.compile(r'comment comment.*'))
और अन्य रूपों के बहुत सारे उपयोग करने की कोशिश की है, लेकिन मुझे लगता है कि मैं कुछ के बारे में कैसे regex अभिव्यक्ति या मैच() काम यहाँ स्पष्ट याद कर रहा हूँ। क्या कोई मेरी मदद कर सकता है?
सबसे पहले, क्या आप बीएस 3, या बीएस 4 का उपयोग कर रहे हैं? किसी को 'findAll' है, किसी के पास 'find_all' है, न तो' findall' है ... – abarnert
क्षमा करें, बीएस 4 - मैंने सीधे अपने कोड से पेस्ट नहीं किया है, संपादित करेंगे। – user1890572
अरे, क्योंकि मेरे पास बीएस 3 का जवाब था ... लेकिन बीएस 4 के लिए, ऐसा लगता है कि यह कक्षाओं में रिक्त स्थान पसंद नहीं करता है? या शायद मैं बस बीएस 4 को पर्याप्त नहीं जानता। मैं 'टिप्पणी' से मेल खा सकता हूं, लेकिन 'टिप्पणी टिप्पणी' नहीं। मैं इस पर गौर करूंगा। – abarnert