मैं इस यूआरएल से एक प्रॉक्सी सूची प्राप्त करने की कोशिश:मैं वेब पेज से डायनामिक सामग्री को कैसे पार्स कर सकता हूं?
इस शांत होगा, लेकिन पोर्ट संख्या गतिशील जावास्क्रिप्ट सामग्री है। मैं इस पृष्ठ से जावास्क्रिप्ट से उत्पन्न सामग्री कैसे प्राप्त कर सकता हूं? मेरे पास jsoup और djNativeSwing है लेकिन मैं इसे पृष्ठभूमि धागे में करना चाहता हूं।
JWebBrowser webBrowser = new JWebBrowser();
webBrowser.navigate("http://spys.ru/en/free-proxy-list/");
System.out.println(webBrowser.getHTMLContent());
यह कोड एक नल परिणाम देता है। कृपया मदद करें।
'htmlUnit' देखें' मुझे लगता है कि यह एक चीज है जिसे आपको चाहिए। धन्यवाद। –
मुझे लगता है कि यह मेरे लिए नहीं है। मेरा कोड सरल और क्रॉसप्लेटफार्म होना चाहिए। जैसा कि मुझे HTMLUnit पता है - सिस्टम पथ होना चाहिए - यह समस्या है – Trump
नहीं, आपको सिस्टम पथ की आवश्यकता नहीं है। मैंने HTMLUnit का उपयोग करके वेब क्रॉलर बनाया जो http प्रोटोकॉल पर काम करता है। तो हाँ यह ठीक से काम करता है। अगर आपको और मदद चाहिए तो मुझे बताएं। यदि आप चाहें तो मैं औपचारिक उत्तर लिख सकता हूं। –