वैन का जवाब बिल्कुल सही है और scipy.stats.ttest_*
फ़ंक्शन का उपयोग बहुत सुविधाजनक है।
लेकिन मैं इस पृष्ठ पर शुद्ध numpy के साथ समाधान की तलाश में आया, जैसा कि शीर्षक में कहा गया है, भरोसेमंद निर्भरता से बचने के लिए। इस अंत में, मुझे यहां दिए गए उदाहरण को इंगित करने दें: https://docs.scipy.org/doc/numpy/reference/generated/numpy.random.standard_t.html
मुख्य समस्या यह है कि numpy संचयी वितरण कार्यों नहीं है, इसलिए मेरा निष्कर्ष यह है कि आपको वास्तव में उपयोग करना चाहिए। मूल प्रश्न मैं अनुमान लगा रहा हूँ कि आप एक टी परीक्षण एक महत्वपूर्ण विचलन है कि क्या वहाँ के साथ अपने डेटासेट और न्यायाधीश की तुलना करना चाहते से
: वैसे भी, केवल numpy का उपयोग कर सकता है? इसके अलावा, नमूने जोड़े गए हैं? (https://en.wikipedia.org/wiki/Student%27s_t-test#Unpaired_and_paired_two-sample_t-tests देखें) उस मामले में, तुम इतनी तरह टी और पी-मूल्य की गणना कर सकते हैं:
import numpy as np
sample1 = np.array([55.0, 55.0, 47.0, 47.0, 55.0, 55.0, 55.0, 63.0])
sample2 = np.array([54.0, 56.0, 48.0, 46.0, 56.0, 56.0, 55.0, 62.0])
# paired sample -> the difference has mean 0
difference = sample1 - sample2
# the t-value is easily computed with numpy
t = (np.mean(difference))/(difference.std(ddof=1)/np.sqrt(len(difference)))
# unfortunately, numpy does not have a build in CDF
# here is a ridiculous work-around integrating by sampling
s = np.random.standard_t(len(difference), size=100000)
p = np.sum(s<t)/float(len(s))
# using a two-sided test
print("There is a {} % probability that the paired samples stem from distributions with the same means.".format(2 * min(p, 1 - p) * 100))
यह There is a 73.028 % probability that the paired samples stem from distributions with the same means.
प्रिंट होगा चूंकि यह किसी भी समझदार विश्वास अंतराल (जैसे कि 5%), आपको चाहिए ऊपर दूर है ठोस मामले के लिए कुछ भी खत्म नहीं है। जवाब देने के लिए
धन्यवाद। ऐसा लगता है कि एक यादृच्छिक चर लेता है। क्या मुझे पहले से ही अपनी नमूना आबादी से एक यादृच्छिक चर उत्पन्न करना है? – Mark
मुझे लगता है कि आप अपने नमूना का उपयोग कर सकते हैं ("नमूना आबादी" नहीं) – van
एक नमूना मूल्य के रूप में नमूना? मैं धारणा है कि मैं एक पैरामीटर के रूप में कई परिणाम का एक नमूना इस्तेमाल कर सकते हैं के तहत किया गया है, लेकिन शायद मैं गुमराह :) – Mark