मैं कुछ डेटा के लिए एक सरल पासवर्ड-सुरक्षित वेब-पोर्टल को मिरर करना चाहता हूं, जिसे मैं प्रतिबिंबित & अद्यतित रखना चाहता हूं। अनिवार्य रूप से यह वेबसाइट फ़ोल्डरों & में व्यवस्थित डेटा के साथ एक निर्देशिका सूची है, मुझे वास्तव में HTML फ़ाइलों को & अन्य स्वरूपण तत्वों को रखने की परवाह नहीं है। हालांकि कुछ विशाल फ़ाइल प्रकार हैं जो डाउनलोड करने के लिए बहुत बड़े हैं, इसलिए मैं इन्हें अनदेखा करना चाहता हूं।दर्पण http वेबसाइट, कुछ फ़ाइलों को छोड़कर
wget -m -R/--reject
ध्वज का उपयोग करके मैं जो चाहता हूं वह लगभग करता है, सिवाय इसके कि सभी फाइलें डाउनलोड हो जाती हैं, फिर यदि वे -आर ध्वज से मेल खाते हैं, तो वे हटा दिए जाते हैं।
यहाँ कैसे मैं wget
उपयोग कर रहा हूँ है:
wget --http-user userName --http-password password -R index.html,*tiff,*bam,*bai -m http://web.server.org/
कौन इस तरह उत्पादन पैदा करता है, पुष्टि है कि एक बहिष्कृत फ़ाइल (index.html) (क) डाउनलोड किया जाता है, और (ख) तो नष्ट कर दिया जाता है:
...
--2012-05-23 09: 38: 38-- http://web.server.org/folder/
मौजूदा web.server.org:80 के लिए कनेक्शन पुनः उपयोग।
HTTP अनुरोध भेजा गया, प्रतिक्रिया का इंतजार ... 401 प्रमाणीकरण आवश्यक
web.server.org:80 के मौजूदा कनेक्शन का पुन: उपयोग करना।
HTTP अनुरोध भेजा है, का इंतजार प्रतिक्रिया ... 200 ठीक
की लंबाई: 2677 (2.6K) [पाठ/HTML]
की बचत करने के लिए: `web.server.org/folder/index.html ' 100% [= ================================================== ================================================== =================>] 2,677 --.- 0sअंतिम संशोधित शीर्षलेख गायब - टाइम-टिकटें बंद हो गईं।
2012-05-23 09:38:39 (328 MB/s) - `web.server.org/folder/index.html 'बचाया [2677/2677]
निकाला जा रहा है web.server.org/folder /index.html क्योंकि इसे अस्वीकार कर दिया जाना चाहिए।
...
वहाँ डाउनलोड करने से पहले फ़ाइल को अस्वीकार करने के wget मजबूर करने के लिए एक तरीका है?
क्या कोई विकल्प है जिसे मुझे विचार करना चाहिए?
इसके अलावा, मुझे उपयोगकर्ता नाम & पासवर्ड की आपूर्ति के बावजूद, प्रत्येक डाउनलोड की गई फ़ाइल के लिए 401 Authorization Required
त्रुटि क्यों मिलती है। यह wget
उपयोगकर्ता नाम/पासवर्ड को आजमाने से पहले, हर बार अन-प्रमाणीकृत कनेक्ट करने का प्रयास करता है।
धन्यवाद, मार्क
देखें इस (डुप्लिकेट) प्रश्न से wget को संशोधित करने के बारे में समाधान: http://stackoverflow.com/questions/12704197/wget-reject-still-downloads-file – taranaki