scrapy

    6गर्मी

    1उत्तर

    का उपयोग करके नेस्टेड 'img src' निकालें मैं उस मामले के लिए स्केपर या पायथन का उपयोग करने के लिए अपेक्षाकृत नया हूं। मैं कुछ अलग लिंक से निकालने के लिए देख रहा हूं और मुझे HTMLXPathSelector अभिव्यक्ति

    5गर्मी

    1उत्तर

    स्कैर फ़ाइलों के साथ फ़ाइलों को डाउनलोड करने के लिए wget का उपयोग कैसे कर सकता हूं फ़ाइलों को ठीक से डाउनलोड नहीं कर रहा है। मेरे पास मेरे आइटम के यूआरएल हैं, इसलिए मुझे लगा कि मैं फ़ाइलों को डाउनलोड

    6गर्मी

    2उत्तर

    मुझे अपने django व्यू में एक स्केपर स्पाइडर को कॉल करने में परेशानी हो रही है। मैं यह कैसे कर सकता हूँ? मैंने इस ट्यूटोरियल http://tryolabs.com/Blog/2011/09/27/calling-scrapy-python-script/ का पालन कर

    17गर्मी

    4उत्तर

    से स्केपर सेटिंग्स तक कैसे पहुंचे I आइटम पाइपलाइन से settings.py में स्केच सेटिंग्स का उपयोग कैसे करूं। दस्तावेज का उल्लेख है कि इसे विस्तार में क्रॉलर के माध्यम से एक्सेस किया जा सकता है, लेकिन मुझे

    14गर्मी

    5उत्तर

    के बाद लॉग में मुद्रित स्क्रैप आइटम दबाएं मेरे पास एक स्केपर प्रोजेक्ट है जहां अंततः मेरी पाइपलाइन में प्रवेश करने वाली वस्तु अपेक्षाकृत बड़ी है और मेटाडेटा और सामग्री को बहुत अधिक स्टोर करती है। सब क

    33गर्मी

    7उत्तर

    मैं स्केपर की नौसिखिया हूं और यह आश्चर्यजनक क्रॉलर ढांचा है जिसे मैंने जाना है! मेरी परियोजना में, मैंने 90,000 से अधिक अनुरोध भेजे, लेकिन उनमें से कुछ विफल हो गए। मैंने लॉग स्तर को INFO होने के लिए स

    5गर्मी

    1उत्तर

    मेरा पहला प्रश्न यहां :) मैं अपने स्कूल की वेबसाइट को सभी संभावित वेबपृष्ठों के लिए क्रॉल करने की कोशिश कर रहा था। लेकिन मुझे एक टेक्स्ट फ़ाइल में लिंक नहीं मिल सकते हैं। मेरे पास सही अनुमतियां हैं, इ

    5गर्मी

    2उत्तर

    के साथ कई फ़ाइलों को लिखना मैं स्क्रैप के साथ एक वेबसाइट स्क्रैप कर रहा हूं और परिणाम को दो भागों में विभाजित करना चाहता हूं। आम तौर पर मैं इस प्रकार स्केपर को कॉल करता हूं: $ scrapy crawl articles -o

    7गर्मी

    8उत्तर

    मैं python2.6 के लिए scrapy स्थापित करने के लिए कोशिश कर रहा हूँ पर scrapy स्थापित है, लेकिन यह अच्छी तरह से नहीं जा रहा लगता है। यहां संकुल स्थापित हैं: G:\Python26\Scripts>pip freeze Scrapy==0.16.4

    9गर्मी

    1उत्तर

    के साथ साइटों के माध्यम से छेड़छाड़ मैं स्केपर के साथ साइटों के माध्यम से कैसे पुन: प्रयास करूं? मैं http://www.saylor.org/site/syllabus.php?cid=NUMBER से मेल खाने वाली सभी साइटों के निकाय को निकालना