इष्टतम मेमोरी प्रदर्शन के करीब कोर के लिए धागे को शेड्यूल करने के लिए कैसे स्मृति के उपयोग पैटर्न पर निर्भर करता है, और आमतौर पर परेशानी के लायक नहीं है। यदि आपका प्रोग्राम जावा में है, तो संभवतः आपको इष्टतम प्रदर्शन के करीब पहुंचने के लिए आवश्यक नियंत्रण स्तर नहीं होने वाला है।
आधुनिक CPUs ने मेमोरी नियंत्रकों को एकीकृत किया है, और आधुनिक बहु-सॉकेट सिस्टम ने स्मृति वितरित की है। यह
Non-Uniform Memory Access (NUMA)
कहा जाता है सॉकेट के बीच आधुनिक बहु सॉकेट इंटेल प्रोसेसर संचार में QPI
QuickPath Interconnect (QPI)
QPI इंटेल वास्तुकला निर्दिष्ट करता है कि यह कैसे काम करता है के साथ किया जाता है। एएमडी का समकक्ष हाइपरट्रांसपोर्ट है।आप यहाँ विभिन्न आर्किटेक्चर के बारे में अधिक सीख सकते हैं:
System Architecture
स्मृति के लिए एक पहुँच है कि स्तर 1 डेटा कैश में याद करते हैं (एक ही सॉकेट में) स्तर 2 डेटा कैश द्वारा सेवित हो सकता है या यह हो सकता है इंटेल ने "अंतिम स्तर कैश (एलएलसी)" को कॉल किया है जो सॉकेट में होगा जिसमें उस स्मृति पते के लिए मेमोरी कंट्रोलर होगा। एलएलसी में एक और सॉकेट में मारना प्रोसेसर चक्र के कुछ दस गुना हो सकता है, लेकिन ड्रम (एक सौ से अधिक प्रोसेसर चक्र) तक पहुंचने से भी तेज़ है।
क्या आप बहुत सारे डेटा पास कर रहे हैं? डेटा कैसे पास किया जाता है (उदाहरण के लिए 0 एमक्यू इस्तेमाल किया जाता है)? – osgx