के साथ टोर प्रॉक्सी का उपयोग करके मुझे उबंटू में टोर स्थापित करने और इसे स्केपर ढांचे के भीतर उपयोग करने में सहायता चाहिए।स्कैर
मैं कुछ शोध किया और इस गाइड में पता चला:
class RetryChangeProxyMiddleware(RetryMiddleware):
def _retry(self, request, reason, spider):
log.msg('Changing proxy')
tn = telnetlib.Telnet('127.0.0.1', 9051)
tn.read_until("Escape character is '^]'.", 2)
tn.write('AUTHENTICATE "267765"\r\n')
tn.read_until("250 OK", 2)
tn.write("signal NEWNYM\r\n")
tn.read_until("250 OK", 2)
tn.write("quit\r\n")
tn.close()
time.sleep(3)
log.msg('Proxy changed')
return RetryMiddleware._retry(self, request, reason, spider)
तो settings.py में इसका इस्तेमाल करते हैं:
DOWNLOADER_MIDDLEWARE = {
'spider.middlewares.RetryChangeProxyMiddleware': 600,
}
और फिर तुम सिर्फ स्थानीय टो प्रॉक्सी के माध्यम से अनुरोध भेजने के लिए चाहते हैं (polipo), जो के साथ किया जा सकता है:
tsocks scrapy crawl spirder
किसी की पुष्टि कर सकते है, कि इस विधि काम करता है और आप di मिल तरंग आईपी?
बस अपने स्वयं के संसाधन पर कोशिश करते हैं और सर्वर लॉग की जाँच करें। और मालिकों से छिपाने के लिए ब्राउज़र पहचानकर्ताओं की सूची सेट करें :) या अपने क्रॉलर के लिए यूनिक आईडी जोड़ें। – nk9
मैं ब्राउज़र पहचान की सूची कैसे सेट करूं? – DjangoPy
ओह ... मैंने स्केपर के साथ काम नहीं किया, इसलिए मैं अभी मदद में हूं :)। लेकिन आपकी साइट पर परीक्षणों के लिए आसान पार्सिंग लॉग – nk9