cuda

    9गर्मी

    1उत्तर

    कॉल करता है मैं क्यूब्लास दिनचर्या को अतुल्यकालिक रूप से कॉल करना चाहता हूं। क्या यह संभव है? यदि हां, तो मैं इसे कैसे प्राप्त कर सकता हूं?

    15गर्मी

    3उत्तर

    मैं इस सवाल को एनवीआईडीआईए डेवलपर मंच पर पूछता था लेकिन चूंकि यह अभी भी नीचे है, शायद यहां कोई मुझे कुछ बता सकता है। क्या किसी को पता है कि एनवीआईडीआईए ड्राइवर में ओपनसीएल 1.2 समर्थन पहले से ही है? यद

    28गर्मी

    1उत्तर

    क्यों डुबल्स के लिए atomicAdd() को CUDA 4.0 या उच्चतर के हिस्से के रूप में स्पष्ट रूप से लागू नहीं किया गया है? CUDA programming guide 4.1 के परिशिष्ट F पृष्ठ 97 से परमाणुओं के निम्नलिखित संस्करण लागू

    10गर्मी

    1उत्तर

    क्या होस्ट डिवाइस के निष्पादन को पूरा करने के लिए इंतजार कर रहा है? उदा। कार्यक्रम संरचना के रूप में // cpu code segment // data transfer from host to device QUESTION - WILL CPU WAIT FOR DEVICE TO

    11गर्मी

    1उत्तर

    मैं जीपीयू प्रोग्रामिंग के लिए काफी नया हूं, लेकिन चूंकि मेरे पास कम्प्यूटेशनल गहन कार्य है, इसलिए मैं संभावित प्रदर्शन लाभ के लिए जीपीयू में बदल गया हूं। मैंने ArrayFire Free संस्करण के साथ अपने प्रो

    7गर्मी

    2उत्तर

    मैं अपने एप्लिकेशन के फ्लॉप्स की गणना कैसे कर सकता हूं? यदि मेरे पास निष्पादित निर्देशों की कुल संख्या है, तो मैं इसे निष्पादन समय से विभाजित कर सकता हूं। लेकिन, निष्पादित निर्देशों की संख्या को कैसे

    5गर्मी

    1उत्तर

    मैं #define द्वारा संकलित समय में CUDA गणना क्षमता (संस्करण) कैसे प्राप्त कर सकता हूं? उदाहरण के लिए, अगर मैं __ballot का उपयोग करें और साथ संकलन nvcc -c -gencode arch=compute_20,code=sm_20 \ -g

    6गर्मी

    2उत्तर

    मैं क्यूडीए कोड में एक कक्षा को तुरंत चालू करना चाहता हूं, जो इसके कुछ सदस्यों को उसी ब्लॉक में अन्य धागे के साथ साझा करता है। हालांकि, निम्न कोड को संकलित करने का प्रयास करते समय, मुझे त्रुटि मिलती ह

    6गर्मी

    1उत्तर

    मैं, CUDA के साथ एक अजीब समस्या नीचे स्निपेट में, #include <stdio.h> #define OUTPUT_SIZE 26 typedef $PRECISION REAL; extern "C" { __global__ void test_coeff (REAL* results) {

    7गर्मी

    3उत्तर

    पर साझा मेमोरी में बैंक विवादों की अपेक्षित संख्या साझा की गई A साझा स्मृति में 32-बिट पूर्णांक की एक उचित गठबंधन सरणी बनें। यदि एक एकल वार्प यादृच्छिक रूप से A के तत्वों को लाने की कोशिश करता है, तो