cuda

    7गर्मी

    2उत्तर

    जब हम xptxas का उपयोग करके रजिस्टर के उपयोग की जांच हम कुछ इस तरह देखें: ptxas info : Used 63 registers, 244 bytes cmem[0], 51220 bytes cmem[2], 24 bytes cmem[14], 20 bytes cmem[16] मुझे आश्चर्य है

    8गर्मी

    2उत्तर

    मेरे सीयूडीए विकास के लिए, मैं 16 कोर के साथ एक मशीन और 16 जीएम के साथ 1 जीटीएक्स 580 जीपीयू का उपयोग कर रहा हूं। जो काम मैं कर रहा हूं, उसके लिए मैं 16 होस्ट थ्रेड्स (प्रत्येक कोर पर 1) लॉन्च करने की

    8गर्मी

    2उत्तर

    मुझे पीटीएक्स जानकारी --ptxas-options=-v पर बहुत उपयोगी जानकारी नहीं मिल रही है मुझे एक 2008 एनवीसीसी पीडीएफ मिला है जिसमें एक छोटा सा अस्पष्ट है, लेकिन कोई विवरण नहीं है। 1) 64 bytes cmem[0], 12 byte

    5गर्मी

    1उत्तर

    मैं थोड़ा उलझन में हूं कि सीयूडीए कैसे काम करता है, क्या थ्रेड प्रत्येक एक ही निर्देश (सिम) निष्पादित करते हैं लेकिन अलग-अलग इंडेक्स के साथ एकल डेटा का उपयोग करते हैं? या इसे "अलग डेटा" माना जाता है (

    6गर्मी

    2उत्तर

    बनावट मेमोरी आकार जानने के लिए deviceQuery नमूना द्वारा बनावट मेमोरी सूचना आउटपुट की व्याख्या कैसे करें? यहां मेरी बनावट मेमोरी का आउटपुट है। अधिकतम बनावट आयाम का आकार (एक्स, वाई, जेड) -1 डी = (65536)

    8गर्मी

    2उत्तर

    साझा मेमोरी एक्सेस करते समय केर्प्लर 2x या 4x फर्मि की बैंडविड्थ है? प्रोग्रामिंग गाइड राज्यों: (2.X के लिए) "प्रत्येक बैंक के अनुसार दो घड़ी चक्र 32 बिट के एक बैंडविड्थ है", और "प्रत्येक बैंक के अनुस

    65गर्मी

    9उत्तर

    क्या कोई __global__ और __device__ के बीच अंतर का वर्णन कर सकता है? मुझे __device__ का उपयोग कब करना चाहिए, और __global__ का उपयोग कब करना चाहिए?

    5गर्मी

    1उत्तर

    क्या जोर पुस्तकालय के साथ push_back का उपयोग करना संभव है? और वैक्टर के वेक्टर के बारे में क्या? thrust::device_vector<thrust::device_vector<int>> d_vec(4); और device_vectors की एक सरणी बनाने के बार

    14गर्मी

    1उत्तर

    का आउटपुट आउटपुट आउटपुट मैं हाथ से लिखित कर्नेल के लिए अपने प्रत्येक CUDA थ्रेड के लिए संसाधन उपयोग को समझने की कोशिश कर रहा हूं। मैं nvcc -arch=sm_20 -ptxas-options=-v के साथ एक kernel.o फाइल करने के

    10गर्मी

    2उत्तर

    के लिए प्रोग्रामिंग के लिए मुझे क्या चाहिए? क्या मैं CUDA प्रोसेसर Tegra 1/2 पर एप्लिकेशन विकसित कर सकता हूं, मुझे इसके लिए क्या चाहिए और Tegra 1/2 CUDA-क्षमता क्या है? मुझे एंड्रॉइड के लिए एक्लिप्स म