2012-11-10 22 views
8

समानता सूचकांक चुनते समय विचार करने वाले कुछ निर्णय लेने वाले कारक क्या हैं। पियरसन पर इसके विपरीत यूक्लिडियन दूरी किस मामले में पसंद है और इसके विपरीत?किसी विशेष प्रकार की समानता सूचकांक का उपयोग कब करना है? यूक्लिडियन दूरी बनाम पियरसन सहसंबंध

उत्तर

12

सहसंबंध इकाई स्वतंत्र है; यदि आप दस बार वस्तुओं में से एक को स्केल करते हैं, तो आपको अलग-अलग यूक्लिडियन दूरी और समान सहसंबंध दूरी मिल जाएगी। इसलिए, जब आप अपनी अभिव्यक्ति प्रोफ़ाइल द्वारा परिभाषित जीनों के रूप में ऐसी वस्तुओं के बीच दूरी को मापना चाहते हैं तो सहसंबंध मेट्रिक्स उत्कृष्ट होता है।

अक्सर, पूर्ण या स्क्वायर सहसंबंध का उपयोग दूरी मीट्रिक के रूप में किया जाता है, क्योंकि हम इसके संकेत के मुकाबले रिश्ते की ताकत में अधिक रुचि रखते हैं।

हालांकि, सहसंबंध केवल उच्च आयामी डेटा के लिए उपयुक्त है; दो या तीन आयामी डेटा बिंदुओं के लिए इसकी गणना करने का शायद ही कोई बिंदु नहीं है।

यह भी ध्यान रखें कि "पियरसन दूरी" एक भारित प्रकार का यूक्लिडियन दूरी है, और पियरसन सहसंबंध गुणांक का उपयोग करके "सहसंबंध दूरी" नहीं है।

5

यह वास्तव में आपके पास मौजूद एप्लिकेशन परिदृश्य पर निर्भर करता है। बहुत संक्षेप में, यदि आप डेटा से निपट रहे हैं जहां गुणों के मूल्यों में वास्तविक अंतर महत्वपूर्ण है, तो यूक्लिडियन दूरी के साथ जाएं। यदि आप प्रवृत्ति या आकार समानता की तलाश में हैं, तो सहसंबंध के साथ जाओ। यह भी ध्यान रखें, कि यदि आप प्रत्येक ऑब्जेक्ट में जेड-स्कोर सामान्यीकरण करते हैं, तो यूक्लिडियन दूरी समान रूप से पीयर्सन सहसंबंध गुणांक के साथ व्यवहार करती है। पियरसन डेटा के रैखिक परिवर्तनों के प्रति संवेदनशील नहीं है। अन्य प्रकार के सहसंबंध गुणांक हैं जो केवल मूल्यों के रैंक को ध्यान में रखते हैं, जो रैखिक और गैर रैखिक परिवर्तन दोनों के लिए असंवेदनशील होते हैं। ध्यान दें कि असमानता के रूप में सहसंबंध का सामान्य उपयोग 1 - सहसंबंध है, जो मीट्रिक दूरी के लिए सभी नियमों का सम्मान नहीं करता है।

कुछ अध्ययनों से निकटता उपाय एक विशेष आवेदन पर चयन जिस पर, उदाहरण के लिए कर रहे हैं:

पाब्लो ए Jaskowiak, रिकार्डो JGB Campello, इवान जी कोस्टा फिल्हो, "क्लस्टरिंग जीन अभिव्यक्ति माइक्रोएरे डाटा के लिए निकटता के उपाय: एक प्रमाणीकरण पद्धति और एक तुलनात्मक विश्लेषण, "कम्प्यूटेशनल बायोलॉजी और बायोइनफॉरमैटिक्स पर आईईईई/एसीएम लेनदेन, वॉल्यूम। 99, नहीं। प्रीप्रिंट्स, पी। 1, 2013