यह वास्तव में काफी पढ़ने/लिखने csv फ़ाइलें w/numpy के बारे में एक और उत्तर मैं प्रदान की है से संबंधित है:
Python: how to do basic data manipulation like in R?
आप चाहिए निश्चित रूप से उपयोग numpy, कोई बात नहीं क्या बाकी! इंडेक्सिंग की आसानी, आदि अतिरिक्त निर्भरता की लागत से काफी अधिक है (ठीक है, मुझे ऐसा लगता है)। PyTables, ज़ाहिर है, भी numpy पर निर्भर करता है।
अन्यथा, यह वास्तव में आपके एप्लिकेशन, आपके हार्डवेयर और आपके दर्शकों पर निर्भर करता है। मुझे संदेह है कि जिस आकार के बारे में आप बात कर रहे हैं उसकी सीएसवी फाइलों में पढ़ने से पीईटीबल्स की तुलना में गति के मामले में कोई फर्क नहीं पड़ता। लेकिन अगर यह चिंता का विषय है, तो एक बेंचमार्क लिखें! कुछ यादृच्छिक डेटा 100 बार पढ़ें और लिखें। या, यदि पढ़ने के समय अधिक मायने रखते हैं, तो एक बार लिखें, 100 बार पढ़ें, आदि
मुझे दृढ़ता से संदेह है कि पीईटीबल्स एसक्यूएल से बेहतर प्रदर्शन करेगा। एसक्यूएल जटिल मल्टी-टेबल प्रश्नों पर चलेगा (विशेष रूप से यदि आप अक्सर वही करते हैं), लेकिन एकल-टेबल (जिसे "denormalized" कहा जाता है) टेबल क्वेरी पर भी, गति के संदर्भ में pytables को हरा करना मुश्किल होता है। मैं इस बंद हाथ के लिए एक संदर्भ नहीं मिल सकता है, लेकिन यदि आप लिंक यहाँ मेरी कुछ खुदाई करने के लिए सक्षम हो सकता है:
http://www.pytables.org/moin/HowToUse#HintsforSQLusers
मैं इस स्तर पर आप के लिए प्रदर्शन पर अमल अनुमान लगा रहा हूँ होगा कोडर प्रदर्शन की तुलना में पीला। तो, सबसे ऊपर, कुछ ऐसा चुनें जो आपको सबसे ज्यादा समझ में आता है!
अन्य अंक:
एसक्यूएल के साथ के रूप में, PyTables पूर्ववत सुविधा है। सीएसवी फाइलों में यह नहीं होगा, लेकिन आप उन्हें संस्करण नियंत्रण में रख सकते हैं, और आपको वीसीएस को बहुत स्मार्ट होने की आवश्यकता नहीं है (सीएसवी फाइलें टेक्स्ट हैं)।
संबंधित नोट पर, सीएसवी फाइल बाइनरी प्रारूपों से कहीं अधिक बड़ी होगी (आप निश्चित रूप से इसके लिए अपने स्वयं के परीक्षण भी लिख सकते हैं)।
यह संभवतः डेटा के साथ आप क्या कर रहे हैं इस पर निर्भर करता है - यानी आप सुविधा को कैसे परिभाषित करते हैं। क्या आप 1. जब चाहें तो अच्छे दृश्य संपादक के साथ डेटा देखना चाहते हैं 2. शायद एक बार दृष्टि से डेटा जांचें और फिर इसे किसी अन्य प्रोग्राम पर पास करें? यदि आप पहले चाहते हैं और डेटा को 'देखने' के लिए उस कार्यक्षमता की आवश्यकता है तो सीएसवी प्रारूप शायद खराब विकल्प नहीं है। दिया गया 2, pytables शायद अच्छा है। किसी भी मामले में, आपका डेटा छोटा है, क्यों नहीं बचाओ? – Marm0t