2013-02-16 41 views
8

आप एक दुश्मन जहाज को ट्रैक करने वाले विमान हैं जो समुद्र भर में यात्रा करते हैं, इसलिए आपने जहाज के एक्स (वाई, वाई, समय) निर्देशांक एकत्रित किए हैं। आप जानते हैं कि एक छिपी पनडुब्बी जहाज की रक्षा के लिए यात्रा करती है, लेकिन जब उनकी स्थिति के बीच एक सहसंबंध होता है, तो पनडुब्बी अक्सर जहाज से घूमती है, इसलिए जब यह अक्सर इसके पास होती है, तो यह दूसरी तरफ भी हो सकती है कभी-कभी दुनिया। आप पनडुब्बी के रास्ते की भविष्यवाणी करना चाहते हैं, लेकिन दुर्भाग्यवश यह आपके से छिपा हुआ है।क्या मशीन लर्निंग एल्गोरिदम एक समय-श्रृंखला की भविष्यवाणी करने के लिए उपयुक्त है?

लेकिन अप्रैल में एक महीने में आप नोटिस करते हैं कि पनडुब्बी खुद को छिपाने के लिए भूल जाती है, इसलिए आपके पास पनडुब्बी और जहाज दोनों के लिए 1,000 यात्राओं में निर्देशांक की एक श्रृंखला है। इस डेटा का उपयोग करके, आप जहाज के आंदोलनों को देखते हुए छुपे हुए पनडुब्बी के पथ की भविष्यवाणी करने के लिए एक मॉडल बनाना चाहते हैं। बेवकूफ आधार रेखा "पनडुब्बी स्थिति अनुमान =" जहाज की वर्तमान स्थिति "कहनी होगी, लेकिन अप्रैल के डेटा से जहां पनडुब्बी दिखाई दे रही थी, आप देखते हैं कि पनडुब्बी जहाज से थोड़ा आगे होने की प्रवृत्ति है, इसलिए" पनडुब्बी स्थिति अनुमान = जहाज की स्थिति 1 मिनट में "एक बेहतर अनुमान है। इसके अलावा, अप्रैल के आंकड़ों से पता चलता है कि जब जहाज एक विस्तारित अवधि के लिए पानी में रुक जाता है, तो पनडुब्बी तटीय पानी को गश्त से दूर होने की संभावना है। अन्य पैटर्न भी हैं बेशक

पनडुब्बी के पथ की भविष्यवाणी करने के लिए अप्रैल डेटा को प्रशिक्षण डेटा के रूप में देखते हुए आप इस मॉडल का निर्माण कैसे करेंगे? मेरा वर्तमान समाधान एक विज्ञापन-प्रसार रैखिक प्रतिगमन है जहां कारक "यात्रा का समय" हैं, "कार्गो जहाज एक्स समन्वय "," कार्गो जहाज 1 दिन "के लिए निष्क्रिय था, और फिर आर वजन को समझने और क्रॉस-सत्यापन करने के लिए। लेकिन मुझे वास्तव में एक तरीका पसंद आएगा इन कारकों को स्वचालित रूप से अप्रैल डेटा से उत्पन्न करें। साथ ही, अनुक्रम या समय का उपयोग करने वाला एक मॉडल अच्छा होगा, क्योंकि रैखिक प्रतिगमन नहीं करता है और मुझे लगता है कि यह प्रासंगिक है।

संपादित करें: मैंने एक बनाई गई कहानी के साथ समस्या को दोबारा सुधार दिया है, इसलिए यह कम भ्रमित है। मैंने पोस्ट की मूल समस्या यह है:

मेरे पास दो विषयों - एक शिक्षक, और एक छात्र पर नजर रखने वाला डेटा है। यह रूप में है (एक्स, वाई, समय), इसलिए प्रत्येक विषय के लिए इनमें से एक श्रृंखला है। शिक्षक क्या देखता है उस पर प्रभाव डालता है कि छात्र क्या देखता है। केवल शिक्षक डेटा का उपयोग करके, छात्र क्या देख रहे हैं, भविष्यवाणी करने के लिए मैं किस विधि का उपयोग करूंगा? आइए कहें कि मैं छात्र और शिक्षक डेटा के स्वर्ण मानक सेट का उपयोग करके कुछ सीखने वाले एल्गोरिदम को प्रशिक्षित कर सकता हूं।

मैं सोच रहा था कि छुपा मार्कोव मॉडल उचित होगा, विकिपीडिया में परिभाषा को देखते हुए, लेकिन मुझे यकीन नहीं है कि इसे अपने डेटासेट पर अभ्यास में कैसे रखा जाए।

अधिक जानकारी: मेरे पास डेटा है कि एक शिक्षक और छात्र प्रत्येक नक्शे और कुछ रीडिंग्स को कैसे देखते हैं। मेरे पास इनमें से 40 डेटासेट हैं, जो [366,234,0), (386,234,5), ...] का अर्थ है, जिसका अर्थ है कि शिक्षक समय पर (366,234) बिंदु पर देखा और फिर 5 सेकंड बाद देखने के लिए आगे बढ़े समन्वय (386, 234)। मैं एक शिक्षक को सामग्री को कैसे देखता है, इस बारे में भविष्यवाणी करने के लिए एक मॉडल सीखना सीख सकता हूं कि भविष्य में एक छात्र एक ही सामग्री को कैसे देखेगा। तो हो सकता है कि छात्र शिक्षक के रूप में एक ही क्रम में सामग्री को धीमा कर दे लेकिन धीमा हो। या शायद छात्र उतना ही नहीं देखता है लेकिन शिक्षक अधिक सामग्री स्कैन करता है। मेरे पास डेटा के दोनों सेट हैं और यह देखना चाहते हैं कि मुझे कितने मॉडल मिल सकते हैं - क्या मैं शिक्षक के दिखने वाले व्यवहार के 50 पीएक्स के भीतर छात्र के व्यवहार को भविष्यवाणी करने में सक्षम हूं?

+0

ऐसा लगता है कि के प्रत्येक सत्र "के नक्शे-एकटक" एक निर्देशित ग्राफ जी (वी, ई) जहां शीर्षों की प्रत्येक वी एक (एक्स, वाई) के रूप में सोचा जा सकता है निर्देशांक जहां नजर को कुछ थ्रेसहोल्ड समय (मानचित्र में रुचि के बिंदु) से अधिक के लिए निर्देशित किया गया था। एज ई आंख आंदोलन के साथ-साथ उनकी दिशात्मकता में समय क्रम का प्रतिनिधित्व करते हैं। तो, एक शिक्षक के ग्राफ को देखते हुए, आपको एक छात्र का ग्राफ ढूंढना होगा। क्या वो सही है? यदि ऐसा है, तो आप प्रशिक्षण डेटा को ऐसे ग्राफ में सरल बना सकते हैं और उनके पैरामीटर सीख सकते हैं। या: एक बिंदु (x, y) दिया गया शिक्षक देख रहा है, आपको अनुमान लगाने की आवश्यकता है (x, y) जहां छात्र देख रहा है? –

+0

अल्प्टीगिन, हाँ वही है जो मैं करने की कोशिश कर रहा हूं। हालांकि मुझे लगता है कि ग्राफ के लिए समय आयाम भी है। क्या आप शिक्षक ग्राफ से छात्र ग्राफ उत्पन्न करने के लिए कुछ प्रशिक्षित करने के किसी भी तरीके से जानते हैं? – user2077851

+0

ठीक है, मैं कहूंगा कि पहले इन ग्राफों में अपने डेटासेट को सरल बनाएं, उन्हें कल्पना करें। मैं यह नहीं कह सकता कि कौन सी विशिष्ट विधि सफल होगी। –

उत्तर

3

मैं Kalman Filters, या अधिक आम तौर पर, राज्य-अंतरिक्ष मॉडल (एसएसएम) को देखने की सलाह देता हूं, जो कि "एचएमएम की तरह ही, छिपे हुए राज्यों को छोड़कर" जारी किए गए पुस्तक द्वारा परिभाषित पुस्तक द्वारा परिभाषित किया गया है।

मैं इस विषय पर एक पुस्तक अध्याय की सिफारिश कर सकता हूं - केविन पी। मर्फी के "मशीन लर्निंग: एक संभाव्य दृष्टिकोण" में अध्याय 18; ऑनलाइन संसाधन भी हैं (लुकअप कलमैन फ़िल्टर), लेकिन मैं किसी भी विशिष्ट की सिफारिश नहीं कर सकता।

संपादित करें: आप समय-श्रृंखला की भविष्यवाणी करने के लिए कलम फ़िल्टर का उपयोग करने के लिए here संदर्भ प्राप्त कर सकते हैं।

आशा इस मदद करता है,

+0

धन्यवाद ईटोव, मैंने कलमैन फ़िल्टर के बारे में सोचा है, लेकिन ऐसा लगता है कि यह एक दूसरी श्रृंखला की भविष्यवाणी करने के बजाय श्रृंखला में अगले चरणों की भविष्यवाणी करने के लिए उपयोग किया जाता है। क्या आप मुझे दूसरी बार श्रृंखला पर भविष्यवाणी के लिए इसका उपयोग कैसे करेंगे? – user2077851

+0

इसके अलावा, क्या वे मार्कोव धारणा बना रहेंगे, कि केवल हालिया राज्य भविष्य के राज्यों को प्रभावित करेगा? – user2077851

+0

अंतर्ज्ञान यह है कि आप जहाज की स्थिति को पनडुब्बी की स्थिति के शोर माप के रूप में देख सकते हैं। शोर जरूरी नहीं है - पिछले घटनाओं के आधार पर इसका कई प्रभाव हो सकते हैं। तो मूल रूप से, पनडुब्बी की स्थिति की भविष्यवाणी करना छिपे हुए मॉडल पैरामीटर का आकलन करने के समान है। मुझे यकीन नहीं है कि यह सामान्य है जितना आप संदर्भित करते हैं, लेकिन मुझे लगता है कि इसमें से कम से कम उनमें से कुछ शामिल हो सकते हैं। – etov