cuda

    5गर्मी

    1उत्तर

    क्या कोई जानता है कि एसडीके/टूलकिट कौन सा और कहां है सामग्री cutil.h? मैं CUDA toolkits3.2 और toolkits5.0 (मैं इस संस्करण पता है कि यह पहले से ही cutil.h के लिए समर्थित नहीं है) इसके अलावा मैं कुछ how

    7गर्मी

    2उत्तर

    CUDA रनटाइम में सुविधा सुविधा cudaGetErrorString(cudaError_t error) है जो एक पठन योग्य स्ट्रिंग में त्रुटि enum का अनुवाद करता है। cudaGetErrorStringCUDA_SAFE_CALL(someCudaFunction()) मैक्रो में उपयोग

    16गर्मी

    1उत्तर

    का उपयोग कर CUDA ऑब्जेक्ट फ़ाइलों का निर्माण मुझे निम्न सेटअप मिला। मैं सीयूडीए का उपयोग कर एमपीआई और अन्य सामग्री का उपयोग कर सी ++ में लिखे गए ढांचे का विस्तार करने जा रहा हूं। परियोजना निर्माण के ल

    7गर्मी

    1उत्तर

    क्या कोड को फिर से लिखना समझ में आता है ताकि यह डेटा गंध बनावट कैश लोड कर सके (मान लीजिए कि मुझे फ़िल्टरिंग और अन्य बनावट इकाई विकल्पों की आवश्यकता नहीं है) या यह वही है? कुछ डेटा गड़बड़ी L1 कैश और कु

    5गर्मी

    2उत्तर

    पढ़ता है मैं एक बनावट से मूल्यों को पढ़ने की कोशिश करता हूं और उन्हें वापस वैश्विक स्मृति में लिखता हूं। मुझे यकीन है कि लेखन हिस्सा है, काम करता है beause मैं कर्नेल में स्थिर मान डाल सकते हैं और मैं

    10गर्मी

    3उत्तर

    मुझे पता चला कि मेरी ~/.vimrc फ़ाइल में syntax on है लेकिन यह किसी भी CUDA फ़ाइल (.cu) के लिए काम नहीं करता है। यह सुनिश्चित करने के लिए सुनिश्चित नहीं है कि यह कैसे करें।

    11गर्मी

    2उत्तर

    मैं guda को/usr/cuda/local/cuda_runtime.h में शामिल करने के लिए कैसे मजबूर कर सकता हूं? मैं एक सीयूडीए अनुप्रयोग को एक सी रैपर के साथ संकलित करने का प्रयास कर रहा हूं। मैं उबंटू 10.04 चला रहा हूँ। मैं

    6गर्मी

    1उत्तर

    1 डी सरणी का उपयोग होने पर मुझे गतिशील आवंटन के बारे में पता है, लेकिन 2 डी सरणी का उपयोग कब किया जा सकता है? __shared__ float sData[32][32]; कैसे यह गतिशील किया जा सकता है: myKernel<<<blocks, threa

    6गर्मी

    2उत्तर

    NVIDIA website के अनुसार: "CUDA टूलकिट का पूरक है और पूरी तरह से OpenACC निर्देशों प्रोग्रामिंग का समर्थन करता है।" इसका मतलब है OpenACC प्रोग्राम (pargma और एपीआई) nvcc संकलक के साथ संकलित किया जा सक

    9गर्मी

    2उत्तर

    __global__ void add(int a, int b, int *c) { *c = a + b; } int main(void) { int c; int *dev_c; HANDLE_ERROR(cudaMalloc((void**)&dev_c, sizeof(int))); add<<<1,1>>>(2, 7, dev_c); HANDLE_ERROR