आर

2012-09-05 13 views
5

में लॉजिस्टिक रिग्रेशन के लिए वर्गीकरण तालिका मेरे पास एक डेटा सेट है जिसमें एक डीएसओटीओमस निर्भर चर (Y) और 12 स्वतंत्र चर (X1 से X12) एक सीएसवी फ़ाइल में संग्रहीत है।आर

Y,X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,X12 
0,9,3.86,111,126,14,13,1,7,7,0,M,46-50 
1,7074,3.88,232,4654,143,349,2,27,18,6,M,25-30 
1,5120,27.45,97,2924,298,324,3,56,21,0,M,31-35 
1,18656,79.32,408,1648,303,8730,286,294,62,28,M,25-30 
0,3869,21.23,260,2164,550,320,3,42,203,3,F,18-24 

मैं निम्नलिखित कोड का उपयोग कर डेटा से एक रसद प्रतिगमन मॉडल का निर्माण:: यहाँ डेटा के पहले 5 पंक्तियों

mydata <- read.csv("data.csv")  
mylogit <- glm(Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
       family="binomial") 
mysteps <- step(mylogit, Y~X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12, data=mydata, 
       family="binomial") 

मैं कोड का उपयोग कर प्रत्येक डेटा के लिए भविष्यवाणी की संभावनाओं प्राप्त कर सकते हैं :

theProbs <- fitted(mysteps) 

अब, मैं एक वर्गीकरण तालिका बनाने के लिए चाहते हैं - जहाँ से मैं perce निर्धारित कर सकते हैं - डेटा तालिका (mydata) के पहले 20 पंक्तियों का उपयोग कर अनुमानित संभावनाओं का ntage जो वास्तव में डेटा के साथ सहमत हैं। ध्यान दें कि निर्भर चर (Y) के लिए, 0 संभावना से दर्शाता है जो 0.5 से कम है, और 1 संभावना से अधिक है जो 0.5 से अधिक है।

मैंने सफलता के बिना वर्गीकरण बनाने की कोशिश करने में कई घंटे बिताए हैं। अगर कोई ऐसा कोड सुझाता है जो इस समस्या को हल करने में मदद कर सकता है तो मैं इसकी बहुत सराहना करता हूं।

+6

क्या 'टेबल के बारे में (theProbs> .5, MyData $ वाई)' (इस पर सबसेट तक आसान है पहले 20 अवलोकन)? – chl

+0

धन्यवाद दस लाख ची। मुझे लगता है कि यह वही है जो मुझे चाहिए था। धन्यवाद फिर से और सबसे अच्छा संबंध है। –

उत्तर

1

मुझे लगता है कि 'राउंड' यहां नौकरी कर सकता है।
तालिका (राउंड (द प्रॉब्स))

8

प्रश्न थोड़ा पुराना है, लेकिन मुझे लगता है कि अगर कोई अभिलेखागार देख रहा है, तो इससे मदद मिल सकती है। यह आसानी से xtabs द्वारा किया जाता है

classDF <- data.frame(response = mydata$Y, predicted = round(fitted(mysteps),0)) 

xtabs(~ predicted + response, data = classDF) 

जो इस तरह एक मेज का उत्पादन करेगा:

  response 
predicted 0 1 
     0 339 126 
     1 130 394