cuda

6गर्मी

1उत्तर

पर बड़े मैट्रिक्स गुणा को मुझे बड़ी मैट्रिक्स के लिए सीयूडीए के साथ जीपीयू पर एक मैट्रिक्स गुणा लागू करने की आवश्यकता है। अकेले प्रत्येक मैट्रिक्स का आकार GPU स्मृति से बड़ा है। तो मुझे लगता है कि मुझ

5गर्मी

1उत्तर

NVCC चेतावनी स्तर

मैं NVCC एक त्रुटि के रूप में नीचे चेतावनी के इलाज के लिए करना चाहते हैं: warning : calling a __host__ function("foo") from a __host__ __device__ function("bar") NVCC प्रलेखन "NVIDIA CUDA संकलक ड्रा

7गर्मी

4उत्तर

क्यूडा

वर्चुअल और वास्तविक वास्तुकला के बीच अंतर को समझने की कोशिश कर रहा है, और विभिन्न कॉन्फ़िगरेशन प्रोग्राम के प्रदर्शन को कैसे प्रभावित करेंगे, उदाहरण के लिए वर्चुअल और वास्तविक आर्किटेक्चर के बीच अंतर।

5गर्मी

1उत्तर

सक्रिय CUDA डिवाइस से गुण कैसे प्राप्त करें?

CUDA डिवाइस (!) से गुण प्राप्त करने के लिए अच्छी तरह से पता कोड सभी उपकरणों पर गणना कर रहा है, और तब से गुण प्राप्त कर रहा है। तब मैं ऐसा टुकड़ा देखता हूं, जो डिवाइस को सक्रिय करता है। मुझे रिवर्स में

8गर्मी

1उत्तर

cudaMemcpy() बनाम cudaMemcpyFromSymbol()

मैं यह पता लगाने की कोशिश कर रहा हूं कि क्यों cudaMemcpyFromSymbol() मौजूद है। यह सब कुछ लगता है कि 'प्रतीक' func कर सकते हैं, nonSymbol cmds कर सकते हैं। प्रतीक func किसी सरणी या अनुक्रमणिका को स्थान

12गर्मी

3उत्तर

NVCC

साथ संकलक चेतावनी को अक्षम कैसे मैं एक विशिष्ट संकलक nvcc साथ चेतावनी को अक्षम करना चाहते हैं, विशेष रूप चेतावनी: शून्य संदर्भ अनुमति नहीं है कोड मैं पर काम कर रहा हूँ NULL संदर्भ का उपयोग करता है SFI

5गर्मी

1उत्तर

CUDA में विचलन - कर्नेल

में एक धागे से बाहर निकलें मैं सोच रहा हूं कि मैं थ्रेड से कैसे बाहर निकल सकता हूं, जिसका धागा सूचकांक बड़ा है। मैं दो संभावनाओं को देखने: int i = threadIdx.x; if(i >= count) return; // do logi

10गर्मी

2उत्तर

समांतर

में सीयूडीए कर्नेल लॉन्च करने वाली कई प्रक्रियाएं मुझे पता है कि गणना क्षमता 2.x या इससे अधिक के साथ एनवीआईडीआईए जीपीयस आपको 16 कर्नेल के साथ एक साथ निष्पादित कर सकता है। हालांकि, मेरा आवेदन 7 "प्रक्र

6गर्मी

2उत्तर

मैटलैब + सीयूडीए मैट्रिक्स-वेक्टर समीकरण को हल करने में धीमा ए * एक्स = बी

मैं समीकरण ए * एक्स = बी की गणना कर रहा हूं, जहां ए एक मैट्रिक्स है और बी एक वेक्टर है, एक्स उत्तर (अज्ञात) वेक्टर है। हार्डवेयर चश्मा: इंटेल i7 3630QM (4 कोर), nVidia GeForce जी.टी. 640m (384 CUDA को

5गर्मी

2उत्तर

जेनरेटिंग एईएस (एईएस -256) लुकअप टेबल्स

मैं एनवीडिया सीयूडीए का उपयोग कर सीटीआर मोड में एईएस -256 को लागू करने की कोशिश कर रहा हूं। मैंने मुख्य विस्तार के लिए सीपीयू कोड सफलतापूर्वक कोड किया है और अब मुझे वास्तविक एईएस -256 एल्गोरिदम लागू क