के लिए पहली कुछ पंक्तियों को पढ़ने का तरीका read_csv
का उपयोग करने के लिए एक अंतर्निहित तरीका है, जो कि समय से पहले लाइनों की लंबाई को जानने के बिना फ़ाइल की पहली n
पंक्तियों को पढ़ने के लिए है? मेरे पास एक बड़ी फाइल है जो पढ़ने के लिए काफी समय लेती है, और कभी-कभी केवल पहले का उपयोग करना चाहती है, कहें, 20 लाइनें इसका नमूना प्राप्त करने के लिए (और पूर्ण चीज़ लोड नहीं करना और इसके सिर को लेना पसंद करते हैं)।पांडा डेटाफ्रेम
यदि मुझे पता था कि लाइनों की कुल संख्या मैं footer_lines = total_lines - n
जैसे कुछ कर सकता हूं और इसे skipfooter
कीवर्ड तर्क में भेज सकता हूं। मेरे वर्तमान समाधान मैन्युअल पांडा को अजगर और यह StringIO के साथ पहली n
लाइनों आकर्षित करने के लिए है:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
यह है कि बुरा नहीं है, लेकिन वहाँ एक और अधिक संक्षिप्त, 'pandasic' जिस तरह से खोजशब्दों के साथ यह करने के लिए है (?) या कुछ और?
अंतिम _N_ लाइन चेकआउट [यह SO पोस्ट] लोड करने के तरीके को देखने के लिए (http://stackoverflow.com/questions/17108250/efficiently-read-last-n-rows-of-csv-into-dataframe) – zelusp
क्या आपका मतलब "पांडस्टिक" था? :) –