मेरे काम के हिस्से के रूप में हमें सालाना लगभग 25TB लायक फाइलें मिलती हैं, वर्तमान में इसे एनएफएस आधारित फाइल सिस्टम पर सहेजा गया है। कुछ zipped/tar.gz में संग्रहित होते हैं जबकि अन्य शुद्ध टेक्स्ट प्रारूप में रहते हैं।लाखों लॉग फ़ाइलों को संग्रहीत करना - लगभग 25 टीबी एक वर्ष
मैं एक एनएफएस आधारित प्रणाली का उपयोग करने के विकल्पों की तलाश में हूं। मैंने मोंगो डीबी, कॉच डीबी को देखा। तथ्य यह है कि वे दस्तावेज़ उन्मुख डेटाबेस हैं, यह सही फिट बनाने के लिए लगता है। हालांकि डीबी में स्टोर करने के लिए लॉग फाइल सामग्री को जेएसओएन में बदलना होगा। कुछ मैं करने के लिए तैयार नहीं हूँ। मुझे लॉग फाइल सामग्री को बनाए रखने की आवश्यकता है।
उपयोग के लिए हम एक छोटा आरईएसटी एपीआई डालने का इरादा रखते हैं और लोगों को फ़ाइल लिस्टिंग, नवीनतम फाइलें और फ़ाइल प्राप्त करने की क्षमता प्राप्त करने की अनुमति देते हैं।
प्रस्तावित समाधान/विचारों को आवेदन स्तर पर वितरित डेटाबेस या फाइल सिस्टम का कुछ रूप होना चाहिए जहां कोई लॉग फाइल स्टोर कर सकता है और अधिक मशीनों को जोड़कर क्षैतिज रूप से प्रभावी ढंग से स्केल कर सकता है।
अंकुर
बस गणित करने के लिए: यह 500GB/सप्ताह या 100GB प्रत्येक व्यावसायिक दिन है। – egrunin
आप क्या लॉगिंग कर रहे हैं? गणित के लिए – ChaosPandion
@egrunin धन्यवाद। हमारे पास पहले से ही एक साल का डेटा है। @chaos ये लॉग फ़ाइलें विश्व स्तर पर स्थापित स्टोरेज एरे से आती हैं। –