scrapy

6गर्मी

1उत्तर

का उपयोग करके नेस्टेड 'img src' निकालें मैं उस मामले के लिए स्केपर या पायथन का उपयोग करने के लिए अपेक्षाकृत नया हूं। मैं कुछ अलग लिंक से निकालने के लिए देख रहा हूं और मुझे HTMLXPathSelector अभिव्यक्ति

5गर्मी

1उत्तर

मैं स्केपर

स्कैर फ़ाइलों के साथ फ़ाइलों को डाउनलोड करने के लिए wget का उपयोग कैसे कर सकता हूं फ़ाइलों को ठीक से डाउनलोड नहीं कर रहा है। मेरे पास मेरे आइटम के यूआरएल हैं, इसलिए मुझे लगा कि मैं फ़ाइलों को डाउनलोड

6गर्मी

2उत्तर

एक Django ऐप के माध्यम से स्केपर स्पाइडर को कैसे कॉल करें

मुझे अपने django व्यू में एक स्केपर स्पाइडर को कॉल करने में परेशानी हो रही है। मैं यह कैसे कर सकता हूँ? मैंने इस ट्यूटोरियल http://tryolabs.com/Blog/2011/09/27/calling-scrapy-python-script/ का पालन कर

17गर्मी

4उत्तर

आइटम पाइपलाइन

से स्केपर सेटिंग्स तक कैसे पहुंचे I आइटम पाइपलाइन से settings.py में स्केच सेटिंग्स का उपयोग कैसे करूं। दस्तावेज का उल्लेख है कि इसे विस्तार में क्रॉलर के माध्यम से एक्सेस किया जा सकता है, लेकिन मुझे

14गर्मी

5उत्तर

पाइपलाइन

के बाद लॉग में मुद्रित स्क्रैप आइटम दबाएं मेरे पास एक स्केपर प्रोजेक्ट है जहां अंततः मेरी पाइपलाइन में प्रवेश करने वाली वस्तु अपेक्षाकृत बड़ी है और मेटाडेटा और सामग्री को बहुत अधिक स्टोर करती है। सब क

33गर्मी

7उत्तर

स्केपर विफलता यूआरएल कैसे प्राप्त करें?

मैं स्केपर की नौसिखिया हूं और यह आश्चर्यजनक क्रॉलर ढांचा है जिसे मैंने जाना है! मेरी परियोजना में, मैंने 90,000 से अधिक अनुरोध भेजे, लेकिन उनमें से कुछ विफल हो गए। मैंने लॉग स्तर को INFO होने के लिए स

5गर्मी

1उत्तर

स्केपर के साथ किसी वेबपृष्ठ के सभी लिंक क्रॉल करने का प्रयास कर रहा है। लेकिन मैं किसी पृष्ठ पर लिंक आउटपुट नहीं कर सकता

मेरा पहला प्रश्न यहां :) मैं अपने स्कूल की वेबसाइट को सभी संभावित वेबपृष्ठों के लिए क्रॉल करने की कोशिश कर रहा था। लेकिन मुझे एक टेक्स्ट फ़ाइल में लिंक नहीं मिल सकते हैं। मेरे पास सही अनुमतियां हैं, इ

5गर्मी

2उत्तर

स्केपर

के साथ कई फ़ाइलों को लिखना मैं स्क्रैप के साथ एक वेबसाइट स्क्रैप कर रहा हूं और परिणाम को दो भागों में विभाजित करना चाहता हूं। आम तौर पर मैं इस प्रकार स्केपर को कॉल करता हूं: $ scrapy crawl articles -o

7गर्मी

8उत्तर

जीत 7 (64-बिट)

मैं python2.6 के लिए scrapy स्थापित करने के लिए कोशिश कर रहा हूँ पर scrapy स्थापित है, लेकिन यह अच्छी तरह से नहीं जा रहा लगता है। यहां संकुल स्थापित हैं: G:\Python26\Scripts>pip freeze Scrapy==0.16.4

9गर्मी

1उत्तर

पायथन स्कैंच

के साथ साइटों के माध्यम से छेड़छाड़ मैं स्केपर के साथ साइटों के माध्यम से कैसे पुन: प्रयास करूं? मैं http://www.saylor.org/site/syllabus.php?cid=NUMBER से मेल खाने वाली सभी साइटों के निकाय को निकालना