का उपयोग कर दिए गए यूआरएल से बेस यूआरएल कैसे प्राप्त करें मैं जावा का उपयोग कर बेस यूआरएल लाने की कोशिश कर रहा हूं। मैंने शीर्षक प्राप्त करने के लिए अपने कोड में jtidy पार्सर का उपयोग किया है। मुझे jtidy का उपयोग करके शीर्षक ठीक से मिल रहा है, लेकिन मुझे दिए गए यूआरएल से बेस यूआरएल नहीं मिल रहा है। ,जावा
String s1 = "http://staff.unak.is/andy/GameProgramming0910/new_page_2.htm";
String s2 = "http://www.complex.com/pop-culture/2011/04/10-hottest-women-in-fast-and-furious-movies";
पहली स्ट्रिंग से मैं "http://staff.unak.is/andy/GameProgramming0910/"
एक बेस URL की तरह लाने के लिए चाहते हैं और दूसरी स्ट्रिंग से, मैं "http://www.complex.com/"
एक बेस URL की तरह हैं:
मैं इनपुट के रूप में कुछ URL है।
मैं कोड का उपयोग कर रहा:
URL url = new URL(s1);
HttpURLConnection conn = (HttpURLConnection) url.openConnection();
InputStream in = conn.getInputStream();
Document doc = new Tidy().parseDOM(in, null);
String titleText = doc.getElementsByTagName("title").item(0).getFirstChild()
.getNodeValue();
मैं titletext
हो रही है, लेकिन मुझे पता है कि दिए गए URL ऊपर से आधार URL प्राप्त करने के लिए दे सकते हैं, कृपया?
क्या नियम आपको बता होता है कि 'http: // www.complex.com/'आधार यूआरएल है और नहीं 'http: // www.complex.com/पॉप-संस्कृति/2011/04 /'? –