आर

2009-07-25 11 views
22

में फिट कार्यों की भलाई आपके डेटा में वक्र फिट करने के लिए आर में आप किस फ़ंक्शन का उपयोग करते हैं और यह जांचते हैं कि वक्र कितना अच्छा फिट बैठता है? क्या परिणाम अच्छे माना जाता है?आर

+0

मैंने वाणिज्यिक सॉफ़्टवेयर का उपयोग किया है जो सर्वोत्तम फिट ढूंढने के लिए कई सूत्रों (घंटे लेना, यदि आप चाहें) का प्रयास करता है। मुझे आर – Nosredna

+1

में ऐसा कुछ ढूंढना अच्छा लगेगा - मैंने सोचा कि आर वास्तविक संख्या का डोमेन था। –

उत्तर

25

बस उस प्रश्न का पहला भाग पूरी किताबें भर सकता है। बस कुछ त्वरित विकल्प:

  • मानक रैखिक मॉडल
  • सामान्यीकृत रेखीय मॉडल के लिए glm() मजबूत रैखिक मॉडल
  • lmrob() पैकेज robustbase से मजबूत करने के लिए के लिए पैकेज मास से (रसद ​​प्रतिगमन के लिए उदाहरण के लिए)
  • rlm() के लिए lm() रैखिक मॉडल
  • loess() गैर-रैखिक/गैर-पैरामीट्रिक मॉडल के लिए

फिर डोमेन-विशिष्ट मॉडल उदा। समय श्रृंखला, सूक्ष्म अर्थशास्त्र, मिश्रित प्रभाव और बहुत कुछ। उदाहरण के रूप में कई कार्य दृश्य Econometrics अधिक जानकारी में इस पर चर्चा करें। फिट होने की भलाई के लिए, यह भी कुछ है जो आसानी से चर्चा करने वाली पूरी पुस्तक खर्च कर सकता है।

+0

फिट की भलाई पर किताबों या अच्छी वेबसाइटों के लिए कोई सिफारिशें? –

7

nls() फ़ंक्शन (http://sekhon.berkeley.edu/stats/html/nls.html) nonlinear कम-वर्ग वक्र फिटिंग के लिए बहुत मानक है। ची वर्ग (वर्ग के अवशेषों का योग) उस मामले में अनुकूलित मीट्रिक है, लेकिन यह सामान्य नहीं है, इसलिए आप यह निर्धारित करने के लिए आसानी से इसका उपयोग नहीं कर सकते कि फिट कितना अच्छा है। मुख्य बात यह है कि आपको यह सुनिश्चित करना चाहिए कि आपके अवशेष सामान्य रूप से वितरित किए जाते हैं। दुर्भाग्य से मुझे ऐसा करने का एक स्वचालित तरीका सुनिश्चित नहीं है।

6

त्वरित अनुसंधान साइट फिटिंग मॉडल के लिए इस्तेमाल बुनियादी कार्यों में से एक उचित अच्छा सारांश है और फिट परीक्षण, नमूना आर कोड के साथ:

10

विहित की अवस्था के workhorses फिटिंग आर में lm(), glm() और nls() हैं। मेरे लिए, मॉडल चयन की बड़ी समस्या में भलाई-फिट-फिट एक सबप्रोबलेम है। वास्तव में, गलत तरीके से फिटनेस का उपयोग करके (उदाहरण के लिए, चरणबद्ध प्रतिगमन के माध्यम से) गंभीरता से मिस्पीस्पेस्ड मॉडल को जन्म दे सकता है ("रिग्रेशन मॉडलिंग रणनीतियां" पर हैरेल की पुस्तक देखें)। स्क्रैच से इस मुद्दे पर चर्चा करने के बजाय, मैं हैरेल की पुस्तक lm और glm के लिए अनुशंसा करता हूं। वेनेबल्स और रिपली का बाइबल टर्से है, लेकिन अभी भी एक पठन के लायक है। फरावे द्वारा "आर के साथ रैखिक मॉडल का विस्तार" व्यापक और पठनीय है। एनएलएस इन स्रोतों में शामिल नहीं है, लेकिन रिट्ज & द्वारा "आरलाइन के साथ नॉनलाइनर रिग्रेशन" स्ट्रैबिग अंतर को भरता है और बहुत हाथ से चल रहा है।

3

मुख्य बात आप यह सुनिश्चित करना चाहिए है कि आपके बच सामान्य रूप से कर रहे हैं वितरित किए। दुर्भाग्य से मैं ऐसा करने के लिए एक स्वचालित तरीका सुनिश्चित नहीं कर रहा हूं।

qqnorm() शायद नमूना क्वांटाइल और सैद्धांतिक क्वांटाइल के बीच सहसंबंध को खोजने के लिए संशोधित किया जा सकता है। अनिवार्य रूप से, यह सामान्य मात्रात्मक साजिश की संख्यात्मक व्याख्या होगी। शायद क्वांटाइल की विभिन्न श्रेणियों के लिए सहसंबंध गुणांक के कई मूल्य प्रदान करना उपयोगी हो सकता है।उदाहरण के लिए, यदि सहसंबंध गुणांक डेटा के मध्य 97% के लिए 1 के करीब है और पूंछ पर बहुत कम है, तो यह हमें बताता है कि अवशेषों का वितरण लगभग सामान्य है, पूंछ में कुछ मज़ेदार चल रहा है।

+0

'shapiro.test()' भी उपयुक्त हो सकता है – DaveRGP

2

सरल रखने के लिए सर्वश्रेष्ठ, और देखें कि रैखिक तरीके "अच्छी तरह से enuff" काम करते हैं या नहीं। आप फिट बैठकर अपनी भलाई का न्याय कर सकते हैं आम तौर पर आर वर्ग और एफ आंकड़े को देखकर, कभी अलग नहीं होते हैं। अपने मॉडल में वेरिएबल्स जोड़ना जिन पर आपके आश्रित चर पर कोई असर नहीं है, आर 2 बढ़ा सकते हैं, इसलिए आपको एफ आंकड़े भी मानना ​​चाहिए।

आपको अपने मॉडल को अन्य नेस्टेड, या अधिक सरल, मॉडल से तुलना करना चाहिए। लॉग liklihood अनुपात परीक्षण का उपयोग करके ऐसा करें, जब तक निर्भर चर समान हैं।

जारक-बेरा परीक्षण अवशिष्ट वितरण की सामान्यता का परीक्षण करने के लिए अच्छा है।