2010-01-29 15 views
10

मैं ए/बी परीक्षण कर रहा हूं और मुझे अपने परिणामों में सिम्पसन के विरोधाभास का सामना करना पड़ रहा है (दिन बनाम महीने बनाम परीक्षण की कुल अवधि)।एबी परीक्षण में सिम्पसन के विरोधाभास का क्या अर्थ है?

  1. क्या इसका मतलब यह है कि मेरा ए/बी परीक्षण सही/प्रतिनिधि नहीं है? (कुछ बाहरी कारक परीक्षण को प्रभावित करते हैं?)
  2. यदि यह समस्या का संकेत है, तो अनुसरण करने के लिए निर्देश क्या हैं?

आपकी महान मदद के लिए धन्यवाद।

अतिरिक्त पठन: http://en.wikipedia.org/wiki/Simpson%27s_paradox

+0

इसी तरह का प्रश्न यहां, क्या आप अंतर्दृष्टि प्रदान कर सकते हैं: http://stats.stackexchange.com/questions/226994/how-to-deal-with-unequal-proportions-in-an-ab-test/227097#227097 –

उत्तर

10

सटीक डेटा & आपके द्वारा परीक्षण किए जा रहे आयामों को देखे बिना थोड़ा मुश्किल कहना है, लेकिन आम तौर पर आप असंगत डेटा के आधार पर निर्णय लेना चाहते हैं। This article from Microsoft सॉफ्टवेयर परीक्षण में सिम्पसन के विरोधाभास का एक सुंदर स्पष्ट उदाहरण देता है।

क्या आप अपने संयुक्त और असंगत डेटा और परीक्षण का एक संक्षिप्त सारांश का एक साफ उदाहरण प्रदान कर सकते हैं?

+0

अच्छा लिंक –

+0

के लिए +1 मुख्य शब्द है: असंगत डेटा। :) धन्यवाद!!! – Toto

+1

मुझे उन लेखों को पसंद नहीं है जो 'पैराडाक्स मजेदार हैं' से शुरू होते हैं। या मैं ...? –

1

सिम्पसन की विरोधाभास केवल तब होता है जब अपने समूह आकार अलग हैं। दरअसल, प्रत्येक समूह के परिणामों के लिए वास्तविक परिणाम एक भारित औसत होते हैं (और इस भारोत्तोलन पर, विरोधाभास आ सकता है)।

यह वास्तव में बाहरी कारकों या सामानों के कारण नहीं होता है। यह बस इसलिए है क्योंकि एक समूह अधिक महत्वपूर्ण है (क्योंकि समूह में अधिक तत्व हैं)।

यदि आप कुछ और जानकारी प्रदान करते हैं, तो हम शायद बेहतर मदद कर सकते हैं।

3

यदि ए स्पष्ट रूप से व्यक्तिगत ए/बी परीक्षणों में काफी बेहतर है, जबकि बी स्कोर कुल में बेहतर है, तो मुख्य निहितार्थ यह है कि आप उन डेटा सेट को से एकत्र नहीं कर सकते हैं। ए बेहतर है।

यदि परीक्षण हर दिन एक ही परिणाम मिलते हैं, तो आपको प्रति दिन अलग-अलग नमूना आकारों के साथ भी यह स्पष्ट परिणाम नहीं मिलेगा। तो मुझे लगता है कि यह अतिरिक्त रूप से तात्पर्य है कि कुछ बदल गया है। हालांकि, यह कुछ भी हो सकता है। हो सकता है कि आपने जो भी परीक्षण किया, वह हर दिन बदल गया (शायद कुछ बहुत सूक्ष्म तरीके से, सर्वर की गति की तरह)। या हो सकता है कि जिन लोगों का आप परीक्षण कर रहे हैं वे बदले में (शायद जनसांख्यिकीय, शायद उनके मनोदशा के मामले में)। इसका मतलब यह नहीं है कि आपका परीक्षण खराब या अमान्य है। इसका मतलब यह है कि आप कुछ ऐसा कर रहे हैं जो चल रहा है, और इससे चीजें मुश्किल हो जाती हैं।

और मैं miscalculating हो सकता है या स्थिति गलतफहमी है, लेकिन मुझे लगता है कि यह भी जरूरी सच है कि आप एक नहीं परीक्षण किया गया है और कई बार की एक ही नंबर बी। यही है, अगर सोमवार को आपने 50 बार और बी 50 बार परीक्षण किया, और मंगलवार को आपने 600 बार और बी 600 बार परीक्षण किया, और इसी तरह, और प्रत्येक दिन एक बहिष्कृत बी, तो मुझे नहीं पता कि आप कैसे प्राप्त कर सकते हैं एक कुल परिणाम जहां बी बीट्स ए है। यदि यह आपके परीक्षण सेटअप के बारे में सच है, तो यह निश्चित रूप से ऐसा लगता है जिसे आप अपने डेटा को आसान बनाने के लिए ठीक कर सकते हैं।