पर फ़ाइल संपीड़ित करें मेरे पास S3 पर 17.7GB फ़ाइल है। यह एक हाइव क्वेरी के आउटपुट के रूप में उत्पन्न किया गया था, और यह संपीड़ित नहीं है।एस 3
मुझे पता है कि इसे संपीड़ित करके, यह लगभग 2.2GB (gzip) होगा। ट्रांसफर बाधा (250kb/s) होने पर जितनी जल्दी संभव हो सके मैं इस फ़ाइल को स्थानीय रूप से कैसे डाउनलोड कर सकता हूं।
मुझे S3 पर फ़ाइल को संपीड़ित करने के लिए कोई सीधा तरीका नहीं मिला है, या s3cmd, boto, या संबंधित टूल में स्थानांतरण पर संपीड़न सक्षम नहीं है।
क्या आपके पास अपनी हाइव क्वेरी को पुन: स्थापित करके इस फ़ाइल को पुन: उत्पन्न करने की क्षमता है? यदि हां, तो मैं आपके हाइव क्वेरी के लिए आउटपुट संपीड़न को सक्षम करने की सलाह दूंगा। –
@ चार्ल्समेनें: मैंने वास्तव में पहली बार ऐसा किया (मुझे लगता है)। हालांकि कथन में 'आदेश' था, और इससे आउटपुट प्रभावित हुआ। आम तौर पर मुझे प्रत्येक नक्शा नौकरी के लिए एक फाइल मिल जाएगी, लेकिन इसके बजाय मुझे कम से कम एक फ़ाइल मिली जो मुझे लगता है कि ऑर्डरिंग कहाँ की गई थी। –
आपने अपनी क्वेरी में आउटपुट संपीड़न कैसे सक्षम किया? मुझे लगता है कि आप 'ऑर्डर बाय' या नहीं, इस पर ध्यान दिए बिना किसी भी हाइव क्वेरी के आउटपुट को संपीड़ित करने में सक्षम होना चाहिए। मुझे लगता है कि आप एक 'सम्मिलित ओवरराइट निर्देशिका' s3n: // ... ',' सही करके एस 3 पर लिख रहे हैं? –