मैंने इस प्रश्न के उत्तर देखे हैं लेकिन मुझे पता नहीं लगा कि कौन से उत्तर सबसे तेज़ प्रदर्शन करेंगे। ये वे जवाब हैं जिन्हें मैंने देखा है - जो सबसे अच्छा है? एक समय मेंरूबी में एक बड़ी फाइल पढ़ने का सबसे तेज़ तरीका क्या है?
- पढ़ें एक पंक्ति प्रत्येक या each_line
- का उपयोग कर एक समय में एक लाइन पढ़ें का उपयोग कर readlines का उपयोग कर लाइनों की एक सरणी में
- यह सब बचाना हो जाता है और उसके बाद प्रत्येक
- उपयोग ग्रेप का उपयोग करें (सुनिश्चित नहीं है कि grep के साथ वास्तव में क्या करना है ...)
- sed का उपयोग करें (सुनिश्चित नहीं है कि वास्तव में क्या करना है ...)
- कुछ और?
साथ ही, क्या किसी अन्य भाषा का उपयोग करना बेहतर होगा या रूबी ठीक होनी चाहिए?
संपादित करें:
अधिक विवरण: प्रत्येक पंक्ति की तरह कुछ होता है "ID1 attr1_1 attr2_1 आईडी 2 attr1_2 attr2_2 ... IDN attr1_n attr2_n" (एन बहुत बड़ा है) और मैं एक डेटाबेस में उन डालना होगा। उस उदाहरण पंक्ति के लिए, मुझे डेटाबेस में एन पंक्तियों को सम्मिलित करने की आवश्यकता होगी।
"बड़ी" फ़ाइल क्या है? आप इसके साथ क्या कर रहे हो क्या प्रदर्शन वास्तव में मायने रखता है? क्या आपने कुछ बेंचमार्क करने की कोशिश की है? –
* कम से कम * 500,000 लाइनों और प्रति पंक्ति हजारों वर्णों पर। प्रत्येक पंक्ति के लिए मैं डेटाबेस के साथ कुछ करूँगा। प्रदर्शन मायने रखता है। मैंने कुछ भी बेंचमार्क नहीं किया है, लेकिन मैं जानना चाहता था कि क्या स्पष्ट उत्तर थे कि वे किस तरह काम करते हैं, इस पर आधारित बहुत तेज़ या धीमे थे। – user1136342
फाइल स्थानीय है? – gmalette