एचडीएफएस की कुछ प्रासंगिक सीमाएं (जो Google फ़ाइल सिस्टम के लिए ओपन-सोर्स ट्विन है) the original Google File System paper में पाई जाती हैं।
लक्ष्य उपयोग के मामलों के बारे में, हम पढ़ें:
तीसरा, सबसे फाइलों नए डेटा जोड़कर बजाय मौजूदा डेटा ओवरराइट करके उत्परिवर्तित कर रहे हैं। रैंडम के भीतर लिखता है एक फ़ाइल व्यावहारिक रूप से मौजूद नहीं है। [...]
[...] को देखते हुए बड़ी फाइलों पर इस का उपयोग पैटर्न, appending प्रदर्शन अनुकूलन और atomicity की गारंटी देता है, का ध्यान केंद्रित [...]
नतीजतन हो जाता है :
[...] हम GFS की स्थिरता मॉडल तक की छूट है बेहद आवेदनों पर कोई दुष्कर बोझ थोप बिना फाइल सिस्टम को आसान बनाने में। हमने परमाणु परिशिष्ट संचालन भी शुरू किया है ताकि एकाधिक ग्राहक को के बीच अतिरिक्त सिंक्रनाइज़ेशन के बिना एक फ़ाइल में समवर्ती रूप से जोड़ सकें।
एक रिकॉर्ड ("रिकॉर्ड"), संलग्न atomically कम से कम एक बार भी समवर्ती म्यूटेशन की उपस्थिति में होना करने के लिए [...]
कारणों डेटा संलग्न अगर मैं कागज पढ़ा सही ढंग से, प्रत्येक फ़ाइल (एचडीएफएस भावना में) की कई प्रतिकृतियां बिल्कुल वही नहीं होंगी। यदि ग्राहक केवल परमाणु संचालन का उपयोग करते हैं, तो प्रत्येक फ़ाइल को रिकॉर्ड्स (प्रत्येक ऑपरेशन में से प्रत्येक) के एक संयोजन के रूप में माना जा सकता है, लेकिन ये कुछ प्रतिकृतियों में डुप्लीकेट दिखाई दे सकते हैं, और उनका ऑर्डर प्रतिकृति से प्रतिलिपि से अलग हो सकता है। (हालांकि स्पष्ट रूप से कुछ पैडिंग भी डाली जा सकती है, इसलिए यह उतना ही साफ नहीं है - पेपर पढ़ें।) यह रिकॉर्ड सीमाओं, अद्वितीय पहचानकर्ताओं, चेकसम आदि का प्रबंधन करने के लिए उपयोगकर्ता पर निर्भर है
तो यह हमारे डेस्कटॉप मशीनों पर उपयोग की जाने वाली फाइल सिस्टम की तरह नहीं है।
ध्यान दें कि HDFS कई छोटे फ़ाइलों के लिए अच्छा नहीं है, क्योंकि:
प्रत्येक आम तौर पर एक 64 एमबी हिस्सा (source) का आवंटन होगा। (: आइटम 1 में के रूप में एक ही स्रोत)
इसकी वास्तुकलानाम फ़ाइल की एक बड़ी संख्या के प्रबंधन में अच्छा नहीं है। एक ही मास्टर है जो सभी फाइलनामों को बनाए रखता है (जो उम्मीद है कि इसकी रैम में फिट हो)।
स्रोत
2016-12-04 11:25:17
धन्यवाद, मैं के लिए क्या देख रहा था क्या। – Andre