वर्चुअल और वास्तविक वास्तुकला के बीच अंतर को समझने की कोशिश कर रहा है, और विभिन्न कॉन्फ़िगरेशन प्रोग्राम के प्रदर्शन को कैसे प्रभावित करेंगे, उदाहरण के लिए वर्चुअल और वास्तविक आर्किटेक्चर के बीच अंतर।क्यूडा
-gencode arch=compute_20,code=sm_20
-gencode arch=compute_20,code=sm_21
-gencode arch=compute_21,code=sm_21
...
निम्नलिखित विवरण NVCC के मैनुअल में दिया गया था,
GPU संकलन एक मध्यवर्ती प्रतिनिधित्व, PTX ([...]) के माध्यम से किया जाता है, एक के लिए विधानसभा के रूप में माना जा सकता है जो आभासी जीपीयू वास्तुकला। वास्तविक ग्राफिक्स प्रोसेसर के विपरीत, ऐसे वर्चुअल जीपीयू को पूरी तरह से क्षमताओं, या सुविधाओं, के सेट द्वारा परिभाषित किया जाता है जो यह एप्लिकेशन को प्रदान करता है। विशेष रूप से, एक वर्चुअल जीपीयू आर्किटेक्चर (काफी हद तक) सामान्य निर्देश सेट प्रदान करता है, और बाइनरी निर्देश एन्कोडिंग एक गैर-समस्या है क्योंकि पीटीएक्स प्रोग्राम हमेशा टेक्स्ट प्रारूप में प्रदर्शित होते हैं। इसलिए, एक एनवीसीसी संकलन आदेश हमेशा दो आर्किटेक्चर का उपयोग करता है: वर्चुअल इंटरमीडिएट आर्किटेक्चर को निर्दिष्ट करने के लिए एक गणना आर्किटेक्चर, साथ ही एक वास्तविक GPU आर्किटेक्चर निष्पादित करने के लिए इच्छित प्रोसेसर निर्दिष्ट करने के लिए। ऐसे एनवीसीसी कमांड के लिए मान्य होने के लिए, वास्तविक आर्किटेक्चर वर्चुअल आर्किटेक्चर का कार्यान्वयन (someway या अन्य) होना चाहिए। यह नीचे आगे बताया गया है। चयनित वर्चुअल आर्किटेक्चर GPU क्षमताओं पर एक बयान का अधिक है जो एप्लिकेशन को आवश्यक है: एक छोटे से वर्चुअल आर्किटेक्चर का उपयोग करने से दूसरे एनवीसीसी चरण के लिए वास्तविक आर्किटेक्चर की विस्तृत श्रेणी की अनुमति मिलती है। इसके विपरीत, वर्चुअल आर्किटेक्चर निर्दिष्ट करना जो अनुप्रयोग द्वारा अप्रयुक्त सुविधाओं को प्रदान करता है, संभावित GPUs सेट को प्रतिबंधित करता है जिसे दूसरे एनवीसीसी चरण में निर्दिष्ट किया जा सकता है।
लेकिन अभी भी यह नहीं पता कि प्रदर्शन विभिन्न कॉन्फ़िगरेशन (या शायद भौतिक जीपीयू उपकरणों के चयन को प्रभावित करेगा) से कैसे प्रभावित होगा। विशेष रूप से, इस बयान मेरे लिए सबसे भ्रामक है:
विशेष रूप से, एक आभासी GPU वास्तुकला एक (मोटे तौर पर) सामान्य अनुदेश सेट प्रदान करता है, और बाइनरी अनुदेश एन्कोडिंग एक गैर मुद्दा है क्योंकि PTX कार्यक्रमों हमेशा प्रतिनिधित्व कर रहे हैं है पाठ प्रारूप में।