cuda

    5गर्मी

    1उत्तर

    मैं सी कोड के माध्यम से सीयूडीए (फर्मि जीपीयू) में डेटा प्रीफेच पर काम कर रहा हूं। सीडीए संदर्भ मैनुअल पीटीएक्स स्तर कोड पर प्रीफेचिंग के बारे में वार्तालाप सी स्तर कोड पर नहीं। किसी को भी मुझे कुछ दस

    40गर्मी

    5उत्तर

    मैं लगभग 10 युक्त एक सांख्यिकीय आवेदन पर काम कर रहा हूँ। कई तरीकों, नेस्टेड छोरों में सरणी पर अलग अलग है, लेकिन स्वतंत्र, गणना प्रदर्शन उदाहरण के लिए: Dictionary<float, int> noOfNumbers = new Dictiona

    5गर्मी

    1उत्तर

    की तुलना में स्थान पर दो बार स्थान पर कब्जा कर लिया गया है, मैंने अभी देखा है कि मेरा CUDA कर्नेल 'सिद्धांत' द्वारा गणना की गई जगह से बिल्कुल दोगुनी जगह का उपयोग करता है। जैसे __global__ void foo() {

    8गर्मी

    1उत्तर

    मैं CUDA प्रोग्रामिंग के लिए नया हूं, और मैं पूरी तरह से अटक गया हूं। cudaGetDeviceCount returned 38 no CUDA-capable device is detected. मैं विंडोज 7, 64-बिट का उपयोग कर रहा: जब मैं या तो आपूर्ति d

    15गर्मी

    2उत्तर

    मैं इसे अजीब ध्वनि पता है, लेकिन यहाँ मेरे परिदृश्य है: मैं एक मैट्रिक्स आव्यूह गुणन (ए (एन * ट) * बी (कश्मीर * एन)), लेकिन मैं केवल विकर्ण तत्वों की जरूरत है क्या करने की जरूरत आउटपुट मैट्रिक्स के लि

    8गर्मी

    1उत्तर

    online प्रलेखन से: cudaError_t cudaMemset (void * devPtr, int value, size_t count) भरता स्मृति क्षेत्र की पहली गिनती बाइट्स निरंतर बाइट मूल्य मूल्य के साथ devPtr द्वारा की ओर इशारा किया। पैरामीटर: d

    5गर्मी

    1उत्तर

    के साथ दृश्य स्टूडियो 2010 में क्यूडा जोर कार्यों को डीबग करने के लिए कैसे मैं विजुअल स्टूडियो 2010, समांतर नाइट 2.2 और सीखने के लिए कुडा 4.2 का उपयोग कर रहा हूं। मेरा सिस्टम विंडोज 8 प्रो x64 है। मैं

    6गर्मी

    2उत्तर

    से कॉपी करें मैं क्यूडा और सी ++ का उपयोग करके जीपीयू पर दो कार्यों (2 कर्नेल में अलग) करने की कोशिश कर रहा हूं। इनपुट के रूप में मैं एक एनएक्सएम मैट्रिक्स लेता हूं (मेजबान पर एक फ्लोट सरणी के रूप में

    19गर्मी

    3उत्तर

    मुझे कर्नेल फ़ंक्शन के अंदर गतिशील रूप से कुछ सरणी आवंटित करने की आवश्यकता है। मैं यह कैसे कर सकता हूं? मेरे कोड ऐसा ही कुछ है: __global__ func(float *grid_d,int n, int nn){ int i,j; float x

    16गर्मी

    1उत्तर

    इन तीन कार्यों, विशेष रूप से अंतिम दो के बीच क्या अंतर है? लाइब्रेरी मैनुअल कहता है ध्यान दें कि यह फ़ंक्शन बहिष्कृत है क्योंकि इसका नाम इसके व्यवहार को प्रतिबिंबित नहीं करता है। इसकी कार्यक्षमता गैर-