html-parsing

    72गर्मी

    6उत्तर

    के साथ कैसे पार्स कर सकता हूं मुझे HTML पृष्ठों की बड़ी मात्रा को पार्स (सर्वर साइड) की आवश्यकता है। हम सभी सहमत हैं कि regexp यहां जाने का तरीका नहीं है। ऐसा लगता है कि जावास्क्रिप्ट एक HTML पृष्ठ को

    5गर्मी

    2उत्तर

    मैं एक HTML दस्तावेज़ में © के लिए देखना चाहता हूं, और मूल रूप से उस इकाई को प्राप्त करता है जिसे कॉपीराइट का श्रेय दिया जाता है। कॉपीराइट लाइन अलग अलग तरीकों की एक जोड़ी दिखाता है: <p class="bg-

    6गर्मी

    1उत्तर

    से कुछ विशेषताओं को हटाएं मैं HTML कोड से आईडी, शैली, कक्षा इत्यादि जैसे कुछ विशेषताओं को कैसे हटा सकता हूं? मैंने सोचा कि मैं lxml.html.clean module का उपयोग कर सकता हूं, लेकिन जैसा कि यह निकला, मैं

    5गर्मी

    1उत्तर

    में "name" द्वारा चुनें मेरे पास एक वेबपृष्ठ यूआरएल में एकाधिक div है जो मुझे पार्स करना है जिसमें समान वर्ग का नाम है लेकिन आईडी के साथ अलग-अलग नाम हैं। उदाहरण के लिए। <div class="answer" style="disp

    5गर्मी

    2उत्तर

    मेरे पास एक वेबसाइट अपडेटर है (लोग सामग्री (टेक्स्ट) को वेबसाइट के रूप में अपडेट नहीं कर सकते हैं) जिसमें एचटीएमएल, जावास्क्रिप्ट फ्रंट एंड लैंग्वेज & पाइथन बैक एंड/सर्वर पक्ष के रूप में है। मैं लग रह

    7गर्मी

    3उत्तर

    वेबसाइट से केवल टैग को कैसे स्क्रैप कर सकता हूं, मैं वेबक्रॉलर पर काम कर रहा हूं। फिलहाल मैं पूरी सामग्री को स्क्रैप करता हूं और फिर नियमित अभिव्यक्ति का उपयोग करके मैं <meta>, <script>, <style> और अन

    14गर्मी

    1उत्तर

    मेरे पास इस तरह का तत्व है: <td> TextA <br/> TextB </td> मैं टेक्स्टए और टेक्स्टबी को अलग से कैसे निकाल सकता हूं?

    5गर्मी

    1उत्तर

    अंदर मैं BeautifulSoup साथ एक वेब पेज को पार्स कर रहा हूँ, और यह जैसे कुछ तत्व है निम्नलिखित: <td><font size="2" color="#00009c"><b>Consultant Registration Number :</b></font> 16043646</td> संरचना ह

    7गर्मी

    3उत्तर

    से टेक्स्ट में एचटीएमएल साफ़ करना प्राप्त करना मैं HTML क्लीनर से प्राप्त HTML को देखना चाहता हूं। मुझे लगता है कि टैगनोड पर धारावाहिक नामक एक विधि है, हालांकि इसे नहीं पता कि इसका उपयोग कैसे किया जाए

    15गर्मी

    2उत्तर

    क्या मैं फॉर्म भर सकता हूं, घटनाओं को निष्पादित कर सकता हूं और जेएसओपी में जावास्क्रिप्ट कार्यों को निष्पादित कर सकता हूं। यदि हाँ मैं कैसे कर सकता हूँ? या मुझे एक और पार्सर के लिए जाना चाहिए।