मैं बड़ी डीएनए अनुक्रम फ़ाइलों (फास्टक फाइल, प्रत्येक गिगाबाइट्स प्रत्येक) का विश्लेषण करने के लिए आर का उपयोग करने की कोशिश कर रहा हूं, लेकिन इन फ़ाइलों के लिए मानक आर इंटरफ़ेस (शॉर्ट रीड) को पूरी फ़ाइल को एक बार में पढ़ना है। यह स्मृति में फिट नहीं है, इसलिए यह एक त्रुटि का कारण बनता है। क्या कोई तरीका है कि मैं एक समय में कुछ (हजार) लाइनें पढ़ सकता हूं, उन्हें एक मेमोरी फ़ाइल में रख सकता हूं, और उसके बाद उस स्मृति फ़ाइल से पढ़ने के लिए शॉर्टरेड का उपयोग कर सकता हूं?क्या आर में स्मृति फ़ाइलों को पढ़ने और लिखने का कोई तरीका है?
मैं पर्ल के आईओ :: अदिश की तरह कुछ के लिए देख रहा हूँ, आर
असल में, मुझे नहीं लगता कि मैं इसके साथ अपनी समस्या का समाधान कर सकता हूं: प्रश्न में फ़ंक्शन (readFastq) एक फ़ाइल * नाम * चाहता है, इसलिए मुझे यकीन नहीं है कि मैं इसके बजाय मनमाना कनेक्शन पास कर सकता हूं। –
मुझे लगता है कि आप जो खोज रहे हैं उसे इस पोस्ट के जवाब में वर्णित किया गया है: http://stackoverflow.com/questions/1727772/quickly-reading-very-large-tables-as-dataframes-in-r/1820610 मैं विशेष रूप से sqldf समाधान की तरह। –