कई फ़ाइल स्टोरेज सिस्टम उसी फ़ाइल सामग्री डेटा (अन्य कारणों के साथ) के डुप्लिकेशंस से बचने के लिए हैश का उपयोग करते हैं, उदाहरण के लिए, गिट और ड्रॉपबॉक्स दोनों SHA256 का उपयोग करते हैं। फ़ाइल नाम और तिथियां अलग-अलग हो सकती हैं, लेकिन जब तक सामग्री को एक ही हैश उत्पन्न होता है, तब तक यह कभी भी एक से अधिक बार संग्रहीत नहीं होता है।क्या कोई भी सामान्य ओएस फाइल सिस्टम एक ही सामग्री डेटा को एक से अधिक बार संग्रहीत करने से बचने के लिए हैश का उपयोग करता है?
ऐसा लगता है कि अंतरिक्ष को बचाने के लिए ओएस फाइल सिस्टम में ऐसा करना एक समझदार बात होगी। क्या विंडोज या * निक्स के लिए कोई फाइल सिस्टम है जो ऐसा करता है, या क्या कोई अच्छा कारण है कि उनमें से कोई भी क्यों नहीं करता?
यह अधिकांश भाग के लिए, डुप्लिकेट फ़ाइल खोजक उपयोगिताओं की आवश्यकता को खत्म कर देगा, क्योंकि उस बिंदु पर आप केवल एक ही स्थान सहेजेंगे जो फ़ाइल सिस्टम में फ़ाइल प्रविष्टि के लिए होगा, जो अधिकांश उपयोगकर्ताओं के लिए पर्याप्त नहीं है बात करने के लिए।
संपादित करें: तर्कसंगत रूप से यह सर्वरफॉल्ट पर जा सकता है, लेकिन मुझे लगता है कि डेवलपर्स को शामिल मुद्दों और व्यापार-बंदों को समझने की अधिक संभावना है।
एक उपयोग केस मेरे हजारों वीडियो फ़ाइलों के साथ मेरा मित्र है, जिनमें से कई अलग-अलग नामों के साथ डुप्लिकेट वीडियो हैं। वह उन सभी को हैश करने के लिए कुछ कोड लिख रहा है और यह पता लगाता है कि वही वीडियो कौन सा है, इसलिए वह डुप्लीकेट को हटा सकता है, और यह मेरे लिए हुआ कि फाइल सिस्टम उसके लिए इसे संभाला जा सकता है। – RedFilter