2012-11-30 18 views
12

sciPy लाइब्रेरी से मैंने उपयोग किया: scipy.stats.stats दो arrays के लिए सहसंबंध गुणांक की गणना करने के लिए pearsonr आयात करें और मुझे इसका मूल्य मिला: (0.80751532276005755, 0.19248467723994242)।पियरसन सहसंबंध गुणांक 2-पूंछ पी-मान अर्थ

मैंने सोचा कि मुझे केवल -1 से +1 के भीतर एक मान मिलेगा, इसलिए मुझे यकीन है कि इन दो परिणामों की व्याख्या कैसे करें। ये मेरी दो सरणियों हैं:

x = [50,500,1500,2500] 
y = [17, 6, 6, 194] 

और मैंने किया:

pearsonr(x,y) 

धन्यवाद

+0

क्या आपने उस फ़ंक्शन के लिए दस्तावेज़ पढ़ने का प्रयास किया था? – Femaref

+0

हां लेकिन मैं 2-पूंछ वाले पी-वैल्यू के अर्थ के बारे में पूरी तरह से निश्चित नहीं हूं। तो पहला मान सहसंबंध है और दूसरा मूल्य एक समान परिणाम उत्पन्न करने वाले अनिश्चित सेट की संभावना है। – user94628

+1

यह अब आंकड़े मंच पर ले जाया जाना चाहिए। यह एक बुनियादी आंकड़े सवाल है। – AGS

उत्तर

18

pearsonr() एक और दो टपल सहसंबंध गुणांक से मिलकर इसी पी मान देता है:

  • सहसंबंध गुणांक -1 से +1 तक हो सकता है।
  • शून्य परिकल्पना यह है कि दो चर असंबद्ध हैं। पी-वैल्यू शून्य और एक के बीच एक संख्या है जो संभावना का प्रतिनिधित्व करता है कि शून्य डेटा परिकल्पना सही होने पर आपका डेटा उत्पन्न होगा।

एक आगे की चर्चा के लिए, http://www.eecs.qmul.ac.uk/~norman/blog_articles/p_values.pdf

मैंने सोचा था कि मैं सिर्फ +1

को रेंज -1 के भीतर एक मूल्य मिल तुम सिर्फ सहसंबंध करने की आवश्यकता है के लिए होता है देखना गुणांक, बस टुपल (पी-वैल्यू) के दूसरे तत्व को अनदेखा करें:

corrxy = pearsonr(x,y)[0] 

यह मी उल्लेखनीय हो सकता है कि numpy.corrcoef() भी है, जो सहसंबंध मैट्रिक्स (पी-मानों के बिना) की गणना करता है।

+0

मैं भी numpy विधि पर एक नज़र डालेंगे। स्पष्टीकरण के लिए धन्यवाद। – user94628