html-parsing

    6गर्मी

    1उत्तर

    मैं क्लोजर का उपयोग कर वेबसाइट पर डेटा भरना स्वचालित करना चाहता हूं। इसके लिए मैं वेबपृष्ठों के तत्वों से पूछना चाहता हूं और http अनुरोध बनाना चाहता हूं। मैं HttpUnit और contrib.clojure.zip-filter.xml

    11गर्मी

    2उत्तर

    के साथ जावास्क्रिप्ट द्वारा उत्पन्न एचटीएमएल एक्सेस करना मैं एक ऐसी वेबसाइट का परीक्षण करने में सक्षम होने की कोशिश कर रहा हूं जो अधिकांश HTML प्रस्तुत करने के लिए जावास्क्रिप्ट का उपयोग करता है। HTML

    8गर्मी

    4उत्तर

    का उपयोग कर सामग्री प्राप्त करने के लिए HTML को पार्स करना मैं एक ऐसे एप्लिकेशन को लिख रहा हूं जो मेरे वेब पृष्ठों के समूह को क्रॉल करता है। पृष्ठ के पूरे स्रोत कोड को लेने के बजाय मैं सभी सामग्री लेन

    17गर्मी

    2उत्तर

    मैं इस साइट से जानकारी (एचटीएमएल टेबल) पार्स करने के लिए कोशिश कर रहा हूँ: http://www.511virginia.org/RoadConditions.aspx?j=All&r=1 वर्तमान में मैं BeautifulSoup उपयोग कर रहा हूँ और मैं इस कोड from me

    6गर्मी

    1उत्तर

    मैं एचटीएमएल चपलता पैक का उपयोग कर HTML तालिका पार्स करने के लिए चाहता हूँ। मैं तालिका से केवल कुछ पूर्वनिर्धारित कॉलम डेटा निकालना चाहता हूं। लेकिन मैं पार्स करने और HTML चपलता पैक करने के लिए नया हू

    28गर्मी

    2उत्तर

    मैं एक ऐसा फ़ंक्शन बनाने की कोशिश कर रहा हूं जो HTML टैग और विशेषताओं को हटा देता है जो एक सफेद सूची में नहीं हैं। मैं उपयोग कर रहा हूँ HTML चपलता पैक और कोड मैं अब तक राशि है <b>first text </b> <b>s

    35गर्मी

    5उत्तर

    तर्क के लिए एक HTML पार्सर मानते हैं। मैंने पढ़ा है कि यह टोकन को पहले सब कुछ टोकन करता है, और फिर इसे पार करता है। टोकन का मतलब क्या है? क्या पार्सर प्रत्येक चरित्र को प्रत्येक को पढ़ता है, संरचना को

    5गर्मी

    2उत्तर

    मैं HTML फ़ाइलों को लोड और पार्स करने के लिए, Jsoup नामक एक HTML पार्सर का उपयोग कर रहा हूं। समस्या यह है कि जिस वेबपृष्ठ को मैं स्क्रैप कर रहा हूं उसे ISO-8859-1 वर्णसेट में एन्कोड किया गया है जबकि ए

    5गर्मी

    2उत्तर

    मेरे पास एक HTML स्रोत के रूप में एक स्ट्रिंग है और मैं यह जांचना चाहता हूं कि स्ट्रिंग वाले HTML स्रोत में एक टैग है जो खोला नहीं गया है। उदाहरण के लिए नीचे दिए गए स्ट्रिंग में WAVEFORM के बाद </u> ह

    23गर्मी

    3उत्तर

    आप कौन सा चयन करेंगे? मेरे महत्वपूर्ण गुण हैं (क्रम में नहीं): समर्थन और भविष्य में वृद्धि। समुदाय और सामान्य ज्ञान आधार (इंटरनेट पर)। व्यापक (आईई, * * * एमएल पृष्ठों की एक विस्तृत श्रृंखला का विश्लेष