प्रश्न 1- मैं पैटर्न को कैसे निकाला जा सकता हूं?
आप अपने डेटा सेट दोनों पर समय श्रृंखला विश्लेषण करके शुरू करेंगे। परीक्षण और तुलना करने के लिए आपको एक सांख्यिकीय पुस्तकालय की आवश्यकता होगी।
यदि आप पाइथन का उपयोग कर सकते हैं, pandas
एक अच्छा विकल्प है।
आर में, forecast
पैकेज बहुत अच्छा है। दोनों डेटा सेट पर ets
चलाकर प्रारंभ करें।
प्रश्न 2 - मैं प्रवृत्ति को कैसे माप सकता हूं क्योंकि मैं रुझानों की तुलना दो अलग-अलग स्थानों से कर सकता हूं?
मात्रा को मापने के पीछे विचार एक (रैखिक) प्रवृत्ति रेखा की तलाश करके शुरू करना है। सभी आँकड़े पैकेज इस के साथ सहायता कर सकते हैं। उदाहरण के लिए, यदि आप एक रैखिक प्रवृत्ति मान रहे हैं, तो वह रेखा जो आपके डेटा बिंदुओं से स्क्वायर विचलन को कम करती है।
trend estimation पर विकिपीडिया लेख काफी सुलभ है। इसके अलावा, ध्यान रखें कि प्रवृत्ति रैखिक, घातीय या नमी हो सकती है। इनकी देखभाल करने के लिए विभिन्न ट्रेंडिंग पैरामीटर की कोशिश की जा सकती है।
प्रश्न 3 - मैं कहां कह सकता हूं कि दो रुझान समान हैं या समान नहीं हैं?
डेटा सेट दोनों पर ARIMA चलाएं। (यहां मूलभूत विचार यह देखने के लिए है कि पैरामीटर का एक ही सेट (जो एआरआईएमए मॉडल बनाता है) आपके अस्थायी समय श्रृंखला दोनों का वर्णन कर सकता है। यदि आप forecast
(आर) में चलाते हैं, तो यह पैरामीटर पी, डी, आपके डेटा के लिए क्यू, एक महान सुविधा।
एक और विचार है कि आप दोनों श्रृंखलाओं का 2-नमूना टी-टेस्ट करें और महत्व के लिए पी-वैल्यू देखें। (चेतावनी: मैं एक सांख्यिकीविद् नहीं हूं, इसलिए मैं मुझे यकीन नहीं है कि समय श्रृंखला के लिए ऐसा करने के खिलाफ कोई सिद्धांत है या नहीं।)
शोध करते समय मैं Granger Test में आया - जहां मूल विचार यह देखना है कि एक बार श्रृंखला किसी दूसरे की भविष्यवाणी करने में मदद कर सकती है या नहीं। आपका मामला
तो ये शुरू करने के लिए केवल कुछ ही चीजें हैं। उम्मीद है की वो मदद करदे।
स्रोत
2012-12-12 20:58:29
यह क्रॉस-मान्य पर होना चाहिए क्योंकि यह सांख्यिकीय दृष्टिकोणों के बारे में एक प्रश्न है, प्रोग्रामिंग नहीं। –