मान लीजिए मैं एक नेस्टेड शब्दकोश 'user_dict' संरचना के साथ है:निर्माण पांडा DataFrame
स्तर 1: प्रयोक्ता-आईडी (लांग पूर्णांक)
स्तर 2: श्रेणी (स्ट्रिंग)
स्तर 3: मिश्रित गुण (तैरता है, ints, आदि ..)
उदाहरण के लिए, इस शब्दकोश का एक प्रवेश होगा:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
"user_dict" में प्रत्येक आइटम एक ही संरचना है और "user_dict" आइटम जो मैं एक पांडा DataFrame को खिलाने के लिए चाहते हैं की एक बड़ी संख्या में शामिल है, से श्रृंखला का निर्माण जिम्मेदार बताते हैं। इस मामले में एक पदानुक्रम सूचकांक उद्देश्य के लिए उपयोगी होगा।
विशेष रूप से, मेरा प्रश्न यह है कि क्या डेटाफ्रेम निर्माता को यह समझने का कोई तरीका मौजूद है कि श्रृंखला को शब्दकोश में "स्तर 3" के मानों से बनाया जाना चाहिए? "स्तर 1" (प्रयोक्ता आईडी के) में
df = pandas.DataFrame(users_summary)
आइटम जो मैं क्या हासिल करना (प्रयोक्ता आईडी सूचकांक के रूप में की है चाहते हैं के विपरीत है, स्तंभों के रूप में लिया जाता है:
अगर मैं की तरह कुछ कोशिश)।
मुझे पता है कि मैं शब्दकोश प्रविष्टियों को फिर से शुरू करने के बाद श्रृंखला का निर्माण कर सकता हूं, लेकिन अगर कोई प्रत्यक्ष तरीका है तो यह बहुत उपयोगी होगा। एक समान सवाल यह पूछेगा कि फाइल में सूचीबद्ध जेसन ऑब्जेक्ट्स से पांडा डेटाफ्रेम बनाना संभव है या नहीं।
क्या मनमाने ढंग से गहराई वाली गड़बड़ी सूचियों के साथ काम करने के लिए इसे सामान्य करने का कोई उचित तरीका है? जैसे एक मनमानी गहराई के लिए सूचियां, जहां कुछ शाखाएं दूसरों की तुलना में कम हो सकती हैं, और जब कोई छोटी शाखाएं अंत तक नहीं पहुंचती हैं तो कोई भी या नन का उपयोग नहीं किया जाता है? – naught101
क्या आपने पांडा जेसन समर्थन (आईओ टूल्स) और सामान्यीकरण देखा है? http://pandas.pydata.org/pandas-docs/dev/io.html#normalization –
मेरी जान बचाएं !!!!!!!!!! बहुत कुछ सीखो !! धन्यवाद – Wen