2012-12-12 133 views
7

मैं समय श्रृंखला विश्लेषण में नया हूं। मैं एक छोटी (1 दिन) तापमान समय श्रृंखला की प्रवृत्ति को खोजने की कोशिश कर रहा हूं और विभिन्न अनुमानों की कोशिश की। इसके अलावा, नमूना आवृत्ति 2 मिनट है। विभिन्न स्टेशनों के लिए डेटा को ध्वस्त कर दिया गया था। और मैं यह देखने के लिए अलग-अलग रुझानों की तुलना करूंगा कि वे समान हैं या नहीं।समय श्रृंखला विश्लेषण में रुझानों की समानता

मैं यह कर में तीन चुनौतियों का सामना करना पड़ रहा हूँ:

Q1 - मैं पैटर्न कैसे निकाल सकते हैं?

प्रश्न 2 - मैं प्रवृत्ति को कैसे माप सकता हूं क्योंकि मैं रुझानों की तुलना दो अलग-अलग स्थानों से करूँगा?

क्यू 3 - मैं कहां कह सकता हूं कि दो रुझान समान हैं या समान नहीं हैं?

+0

यह क्रॉस-मान्य पर होना चाहिए क्योंकि यह सांख्यिकीय दृष्टिकोणों के बारे में एक प्रश्न है, प्रोग्रामिंग नहीं। –

उत्तर

4

प्रश्न 1- मैं पैटर्न को कैसे निकाला जा सकता हूं?

आप अपने डेटा सेट दोनों पर समय श्रृंखला विश्लेषण करके शुरू करेंगे। परीक्षण और तुलना करने के लिए आपको एक सांख्यिकीय पुस्तकालय की आवश्यकता होगी।

यदि आप पाइथन का उपयोग कर सकते हैं, pandas एक अच्छा विकल्प है।

आर में, forecast पैकेज बहुत अच्छा है। दोनों डेटा सेट पर ets चलाकर प्रारंभ करें।

प्रश्न 2 - मैं प्रवृत्ति को कैसे माप सकता हूं क्योंकि मैं रुझानों की तुलना दो अलग-अलग स्थानों से कर सकता हूं?

मात्रा को मापने के पीछे विचार एक (रैखिक) प्रवृत्ति रेखा की तलाश करके शुरू करना है। सभी आँकड़े पैकेज इस के साथ सहायता कर सकते हैं। उदाहरण के लिए, यदि आप एक रैखिक प्रवृत्ति मान रहे हैं, तो वह रेखा जो आपके डेटा बिंदुओं से स्क्वायर विचलन को कम करती है।

trend estimation पर विकिपीडिया लेख काफी सुलभ है। इसके अलावा, ध्यान रखें कि प्रवृत्ति रैखिक, घातीय या नमी हो सकती है। इनकी देखभाल करने के लिए विभिन्न ट्रेंडिंग पैरामीटर की कोशिश की जा सकती है।

प्रश्न 3 - मैं कहां कह सकता हूं कि दो रुझान समान हैं या समान नहीं हैं?

  1. डेटा सेट दोनों पर ARIMA चलाएं। (यहां मूलभूत विचार यह देखने के लिए है कि पैरामीटर का एक ही सेट (जो एआरआईएमए मॉडल बनाता है) आपके अस्थायी समय श्रृंखला दोनों का वर्णन कर सकता है। यदि आप forecast (आर) में चलाते हैं, तो यह पैरामीटर पी, डी, आपके डेटा के लिए क्यू, एक महान सुविधा।

  2. एक और विचार है कि आप दोनों श्रृंखलाओं का 2-नमूना टी-टेस्ट करें और महत्व के लिए पी-वैल्यू देखें। (चेतावनी: मैं एक सांख्यिकीविद् नहीं हूं, इसलिए मैं मुझे यकीन नहीं है कि समय श्रृंखला के लिए ऐसा करने के खिलाफ कोई सिद्धांत है या नहीं।)

  3. शोध करते समय मैं Granger Test में आया - जहां मूल विचार यह देखना है कि एक बार श्रृंखला किसी दूसरे की भविष्यवाणी करने में मदद कर सकती है या नहीं। आपका मामला

तो ये शुरू करने के लिए केवल कुछ ही चीजें हैं। उम्मीद है की वो मदद करदे।

+0

क्या आप पांडस/पायथन में कार्यान्वयन (1) पर टिप्पणी कर सकते हैं - अर्थात्, एक auto.arima() पायथन में समकक्ष। निम्नलिखित में टिप्पणियां बताती हैं कि यह स्वचालन एक काम प्रगति पर था: http://stackoverflow.com/questions/22770352/auto-arima-equivalent-for-python – Quetzalcoatl

+0

@Ram कृपया अपने उत्तर पर एक अनुवर्ती देखें, http://stats.stackexchange.com/questions/172226/proving-similarities-of-two-time-series। – Moe

+0

कुछ टिप्पणियां: 1. खुद को रैखिक प्रवृत्ति रेखा तक सीमित क्यों करें। एक बेहतर शुरुआत शायद ओपी को एक मानक अपघटन उपकरण की ओर इंगित करने के लिए होगी जो इसे मौसमी, प्रवृत्ति और यादृच्छिक घटकों में तोड़ देगी और प्रवृत्ति के लिए कम या समान उपयोग करेगी। 2. दो डेटासेट पर एआरआईएमए चलाने से आपको यह पता लगाने में मदद नहीं मिलेगी कि रुझान समान हैं या नहीं (इसे आज़माएं और देखें - http://stats.stackexchange.com/questions/172226/proving-similarities-of-two-time पर मेरा उत्तर देखें श्रृंखला। –