2012-03-16 28 views
11

किसी ने वेब लिंक HTTP "लिंक" हेडर के लिए ओपन सोर्स सी # पार्सर बनाया है? देखें:
http://tools.ietf.org/html/rfc5988वेब लिंक के लिए सी # पार्सर (आरएफसी 5 9 88)

उदाहरण:

Link: <http://example.com/TheBook/chapter2>; rel="previous"; title="previous chapter" 

धन्यवाद।

अद्यतन: अपना खुद का पार्सर बनाने का अंत: https://github.com/JornWildt/Ramone/blob/master/Ramone/Utility/WebLinkParser.cs। इसका इस्तेमाल करने के लिए स्वतंत्र महसूस करें।

उत्तर

-2

HTML Agility Pac कश्मीर ले लो और सही

SelectNodes

क्वेरी का उपयोग करें।

using HtmlAgilityPack; 

namespace WebScraper 
{ 
    class Program 
    { 
     static void Main(string[] args) 
     { 
      HtmlWeb web = new HtmlWeb(); 
      HtmlDocument doc =web.Load(url); 
      foreach (HtmlNode link in doc.DocumentNode.SelectNodes("//a[@Link]")) 
      { 
      } 
+3

धन्यवाद, लेकिन, नहीं, यह वह नहीं है जो मैं पूछ रहा हूं। मैं http://tools.ietf.org/html/rfc5988 में वर्णित HTTP प्रोटोकॉल स्तर "लिंक" शीर्षलेख का जिक्र कर रहा हूं। –

+0

आप अपने एचटीएमएल दस्तावेज कैसे प्राप्त कर रहे हैं? यदि यह एक वेब रेस्पॉन्स है, तो हेडर एन्युमरेशन है जिसमें LINK होना चाहिए। – weismat

+2

HTTP शीर्षलेख से स्ट्रिंग प्राप्त करने में कोई समस्या नहीं है। समस्या स्ट्रिंग की सामग्री को पार्स कर रही है - इसे यूआरएल, रिला-टाइप, शीर्षक आदि सहित भागों में विभाजित करना। –