cuda

    6गर्मी

    1उत्तर

    पर बड़े मैट्रिक्स गुणा को मुझे बड़ी मैट्रिक्स के लिए सीयूडीए के साथ जीपीयू पर एक मैट्रिक्स गुणा लागू करने की आवश्यकता है। अकेले प्रत्येक मैट्रिक्स का आकार GPU स्मृति से बड़ा है। तो मुझे लगता है कि मुझ

    5गर्मी

    1उत्तर

    मैं NVCC एक त्रुटि के रूप में नीचे चेतावनी के इलाज के लिए करना चाहते हैं: warning : calling a __host__ function("foo") from a __host__ __device__ function("bar") NVCC प्रलेखन "NVIDIA CUDA संकलक ड्रा

    7गर्मी

    4उत्तर

    वर्चुअल और वास्तविक वास्तुकला के बीच अंतर को समझने की कोशिश कर रहा है, और विभिन्न कॉन्फ़िगरेशन प्रोग्राम के प्रदर्शन को कैसे प्रभावित करेंगे, उदाहरण के लिए वर्चुअल और वास्तविक आर्किटेक्चर के बीच अंतर।

    5गर्मी

    1उत्तर

    CUDA डिवाइस (!) से गुण प्राप्त करने के लिए अच्छी तरह से पता कोड सभी उपकरणों पर गणना कर रहा है, और तब से गुण प्राप्त कर रहा है। तब मैं ऐसा टुकड़ा देखता हूं, जो डिवाइस को सक्रिय करता है। मुझे रिवर्स में

    8गर्मी

    1उत्तर

    मैं यह पता लगाने की कोशिश कर रहा हूं कि क्यों cudaMemcpyFromSymbol() मौजूद है। यह सब कुछ लगता है कि 'प्रतीक' func कर सकते हैं, nonSymbol cmds कर सकते हैं। प्रतीक func किसी सरणी या अनुक्रमणिका को स्थान

    12गर्मी

    3उत्तर

    साथ संकलक चेतावनी को अक्षम कैसे मैं एक विशिष्ट संकलक nvcc साथ चेतावनी को अक्षम करना चाहते हैं, विशेष रूप चेतावनी: शून्य संदर्भ अनुमति नहीं है कोड मैं पर काम कर रहा हूँ NULL संदर्भ का उपयोग करता है SFI

    5गर्मी

    1उत्तर

    में एक धागे से बाहर निकलें मैं सोच रहा हूं कि मैं थ्रेड से कैसे बाहर निकल सकता हूं, जिसका धागा सूचकांक बड़ा है। मैं दो संभावनाओं को देखने: int i = threadIdx.x; if(i >= count) return; // do logi

    10गर्मी

    2उत्तर

    में सीयूडीए कर्नेल लॉन्च करने वाली कई प्रक्रियाएं मुझे पता है कि गणना क्षमता 2.x या इससे अधिक के साथ एनवीआईडीआईए जीपीयस आपको 16 कर्नेल के साथ एक साथ निष्पादित कर सकता है। हालांकि, मेरा आवेदन 7 "प्रक्र

    6गर्मी

    2उत्तर

    मैं समीकरण ए * एक्स = बी की गणना कर रहा हूं, जहां ए एक मैट्रिक्स है और बी एक वेक्टर है, एक्स उत्तर (अज्ञात) वेक्टर है। हार्डवेयर चश्मा: इंटेल i7 3630QM (4 कोर), nVidia GeForce जी.टी. 640m (384 CUDA को

    5गर्मी

    2उत्तर

    मैं एनवीडिया सीयूडीए का उपयोग कर सीटीआर मोड में एईएस -256 को लागू करने की कोशिश कर रहा हूं। मैंने मुख्य विस्तार के लिए सीपीयू कोड सफलतापूर्वक कोड किया है और अब मुझे वास्तविक एईएस -256 एल्गोरिदम लागू क