cuda

5गर्मी

1उत्तर

मैंने cuda sdk 5.0 को/opt और यहां तक कि सभी उदाहरणों को संकलित किया, लेकिन मैं nvcc निष्पादित नहीं कर सकता। यहाँ कुछ सांत्वना उत्पादन होता है: मैं लिनक्स टकसाल 13.

5गर्मी

1उत्तर

CUDA परिणाम बहुत बड़े सरणी का उपयोग कर कचरा दिखाए, लेकिन रिपोर्ट कोई त्रुटि

मैं एक परीक्षण कार्यक्रम है कि एक युक्ति है और आकार के एक मेजबान सरणी n कर्नेल कि n धागे जो आवंटित बनाता है पैदा करेगा और उसके बाद लांच बनाने हूँ डिवाइस सरणी में प्रत्येक स्थान पर निरंतर मान 0.95f। पू

9गर्मी

2उत्तर

समांतर कमी

मैंने मार्क हैरिस द्वारा सीयूडीए में समांतर कमी को अनुकूलित करने वाले लेख को पढ़ा है, और मैंने इसे वास्तव में बहुत उपयोगी पाया है, लेकिन फिर भी मैं कभी-कभी 1 या 2 अवधारणाओं को समझने में असमर्थ हूं। //

5गर्मी

2उत्तर

32 ब्लॉक से 32 धागे एक वार के रूप में निर्धारित किया जाएगा?

मैं समझता हूं कि सीयूडीए में, उसी ब्लॉक में 32 आसन्न थ्रेड एक वार के रूप में निर्धारित किए जाएंगे। लेकिन मुझे अक्सर कुछ ट्यूटोरियल CUDA कोड मिलते हैं जिनमें प्रति ब्लॉक 1 थ्रेड के साथ कई ब्लॉक होते है

6गर्मी

1उत्तर

CUDA कर्नेल कक्षा

के सदस्य फ़ंक्शन के रूप में मैं CUDA 5.0 और एक गणना क्षमता 2.1 कार्ड का उपयोग कर रहा हूं। प्रश्न काफी सरल है: क्या कर्नेल कक्षा का हिस्सा हो सकता है? उदाहरण के लिए: class Foo { private: //... publ

6गर्मी

3उत्तर

जीसीसी और एनवीसीसी (जी ++) दो अलग-अलग संरचना आकार क्यों देखते हैं?

मैं सीयूडीए को मौजूदा एकल थ्रेडेड सी प्रोग्राम में जोड़ने की कोशिश कर रहा हूं जो 90 के उत्तरार्ध में कभी-कभी लिखा गया था। ऐसा करने के लिए मुझे दो भाषाओं, सी और सी ++ (एनवीसीसी एक सी ++ कंपाइलर) मिश्रण

5गर्मी

2उत्तर

मैं CUDA 4.0+ कर्नेल के लिए पैरामीटर सूची जानकारी कैसे पुनर्प्राप्त करूं?

cuLaunchKernel function के लिए एनवीडिया दस्तावेज के अनुसार, CUDA 3.2+ के साथ संकलित कर्नेल में उनकी पैरामीटर सूची के बारे में जानकारी होती है। क्या इस जानकारी को प्रोग्रामिंग रूप से एक क्यूफंक्शन हैंड

5गर्मी

1उत्तर

सीधे GPU

पर H.264 वीडियो को एन्कोडिंग एफबीओ बनावट मैं एक ऐप लिखने की योजना बना रहा हूं जिसमें मुझे किसी दिए गए छवि अनुक्रम से वीडियो को एन्कोड करने की क्षमता की आवश्यकता है जो एक एफबीओ संलग्न बनावट से आता है।

5गर्मी

1उत्तर

मैं सीयूडीए डीएल को कॉल करने के लिए उल्लंघन उल्लंघन अपवाद से कैसे बचूं?

मैं कुडा के साथ नया हूं और सी के साथ वास्तव में परिचित नहीं हूं। मैंने अपने सी # प्रोग्राम में सीयूडीए विधियों (एफएफटी) को लागू करने के लिए एक डीएल लिखा था। मैंने पहले डीएल को एक कंसोल एप्लिकेशन के रू

7गर्मी

1उत्तर

CUDA। पहले 32 धागे को अनलोल कैसे करें ताकि उन्हें समानांतर में निष्पादित किया जा सके?

मुझे पता है कि "प्रत्येक वार में निरंतर धागे होते हैं, थ्रेड 0 युक्त पहले वार्प के साथ थ्रेड आईडी बढ़ते हैं" तो पहले 32 थ्रेड पहले वार में होना चाहिए। साथ ही मुझे पता है कि एक वार में सभी धागे किसी भी