.NET

2009-06-04 10 views
8

के साथ एसएसएल पर स्क्रीन स्क्रैपिंग .NET के साथ उपयोग के लिए एसएसएल पर साइट स्क्रैप करने के लिए कौन से समाधान मौजूद हैं?.NET

मेरा उपयोग मामला यह है कि मुझे एक साथी वेबसाइट (https) में लॉगिन करने की आवश्यकता है, एक गतिशील पदानुक्रम के माध्यम से नेविगेट करें, और रिपोर्ट की एक ज़िप फ़ाइल डाउनलोड करें।

यदि मैं .NET में कोई अच्छा व्यवहार्य विकल्प नहीं है, तो फ्रेमवर्क या ओएसएस के दौरान मैं निश्चित रूप से अन्य स्क्रीन स्क्रैपर्स का उपयोग कर सकता हूं।

उत्तर

6

शायद WATIN पर नेविगेटिंग या WebClient अनुकरण करने के लिए विचार करें यदि आप स्वयं आइटम ढूंढ सकते हैं और तर्क को अनुकरण कर सकते हैं।

+0

WatiN ने बहुत अच्छा काम किया। अगर मुझे मैन्युअल रूप से सभी HTML तत्वों को पार्स करना पड़ा तो मैंने खुद को गोली मार दी होगी। –

8

.NET में स्क्रीन स्क्रैपिंग के लिए सोने का मानक HTML Agility Pack है।

जहां तक ​​HTTPS पर पृष्ठों को पुनर्प्राप्त करने, इस लेख का प्रयास करें:

(स्वचालन बजाय के बाद स्क्रीन scraping अन्य उत्तर से उल्लेख किया है, आप वास्तव में किया जा सकता है , इस मामले में आप WatiN के साथ बेहतर हो सकते हैं, स्वचालित रूप से स्वचालित वेब परीक्षण के लिए डिज़ाइन किया गया एक ढांचा, लेकिन जो भी आप चाहते हैं उसके लिए पर्याप्त लचीला है)

4

आप निश्चित रूप से इसे HttpWebRequest के साथ कर सकते हैं, लेकिन लॉग इन करने के लिए उपयोग की जाने वाली कुकीज़ का ट्रैक रखना गैर-तुच्छ हो सकता है। मैं watir (रूबी) या watin (सी #) का उपयोग करने की सलाह दूंगा। दोनों आपके लिए यह सब संभाल लेंगे।

public void SearchForWatiNOnGoogle() 
{ 
using (IE ie = new IE("http://www.google.com")) 
{ 
    ie.TextField(Find.ByName("q")).TypeText("WatiN"); 
    ie.Button(Find.ByName("btnG")).Click(); 

    Assert.IsTrue(ie.ContainsText("WatiN")); 
} 
} 
2

मैं अपने कार्यक्रम में ब्राउज़र होस्टिंग, और jQuery के साथ scraping लोगों के बारे में सुना है:

Watin वेबसाइट से, यहाँ एक उदाहरण है। डीओएम खोजने के लिए jQuery बहुत अच्छा है क्योंकि मेरे लिए बहुत अच्छा लगता है।