में उपयोग के लिए पावर कानून वितरण के बाद एकाधिक चर मानकीकृत/स्केल/सामान्यीकृत करने का सही तरीका मैं सोशल नेटवर्क ग्राफ़ में नोड्स के कुछ मानों को गठबंधन के क्रम में रैंक के लिए एक मान में जोड़ना चाहता हूं:रैखिक संयोजन
in_degree + betweenness_centrality = informal_power_index
समस्या है कि in_degree
और betweenness_centrality
अलग पैमानों पर मापा जाता है, का कहना है कि 0-15 बनाम 0-35,000 और एक बिजली कानून वितरण (कम से कम निश्चित रूप से नहीं सामान्य वितरण)
का पालन है वहाँ एक चर को पुन: सहेजने का अच्छा तरीका ताकि एक डब्ल्यू informal_power_index
निर्धारित करने में दूसरे पर हावी नहीं है?
तीन स्पष्ट दृष्टिकोण हैं:
- चर (घटाना
mean
औरstddev
द्वारा विभाजित) का मानकीकरण। ऐसा लगता है कि यह वितरण को बहुत अधिक स्क्वैश करेगा, लंबी पूंछ में एक मूल्य और चोटी के पास एक के बीच भारी अंतर छुपाएगा। min(variable)
घटाकरmax(variable)
को विभाजित करके सीमा [0,1] में पुन: स्केलिंग चर। यह समस्या को ठीक करने के करीब लगता है क्योंकि यह वितरण के आकार को नहीं बदलेगा, लेकिन हो सकता है कि यह वास्तव में इस मुद्दे को संबोधित नहीं करेगा? विशेष रूप से साधन अलग होंगे।- प्रत्येक मान को
mean(variable)
द्वारा विभाजित करके साधनों को बराबर करें। यह तराजू में अंतर को संबोधित नहीं करेगा, लेकिन तुलना के लिए शायद औसत मूल्य अधिक महत्वपूर्ण हैं?
कोई अन्य विचार?
क्या इस दृष्टिकोण को मानकीकरण विधि के समान समस्या नहीं होगी, यह वितरण को स्क्वैश करेगा ताकि प्रतिशत 95 और 99 बहुत करीब दिखें, भले ही वे दुनिया अलग हों (लगता है कि बिल गेट का बैंक खाता बनाम ... मेरा!) –
यह विधि सब कुछ एक प्रतिशत के भीतर रखती है। यह इस बात पर आधारित नहीं है कि संख्या माध्य से कैसे विचलित हो जाती है। लेकिन, मैं आप पर कार्यप्रणाली पर स्पष्ट नहीं हो सकता है। 2000 arbitary था। जितना बड़ा होगा उतना ही अद्वितीय मूल्य बनाया जा सकता है। – Thad