cuda

    5गर्मी

    1उत्तर

    मैंने cuda sdk 5.0 को/opt और यहां तक ​​कि सभी उदाहरणों को संकलित किया, लेकिन मैं nvcc निष्पादित नहीं कर सकता। यहाँ कुछ सांत्वना उत्पादन होता है: मैं लिनक्स टकसाल 13.

    5गर्मी

    1उत्तर

    मैं एक परीक्षण कार्यक्रम है कि एक युक्ति है और आकार के एक मेजबान सरणी n कर्नेल कि n धागे जो आवंटित बनाता है पैदा करेगा और उसके बाद लांच बनाने हूँ डिवाइस सरणी में प्रत्येक स्थान पर निरंतर मान 0.95f। पू

    9गर्मी

    2उत्तर

    मैंने मार्क हैरिस द्वारा सीयूडीए में समांतर कमी को अनुकूलित करने वाले लेख को पढ़ा है, और मैंने इसे वास्तव में बहुत उपयोगी पाया है, लेकिन फिर भी मैं कभी-कभी 1 या 2 अवधारणाओं को समझने में असमर्थ हूं। //

    5गर्मी

    2उत्तर

    मैं समझता हूं कि सीयूडीए में, उसी ब्लॉक में 32 आसन्न थ्रेड एक वार के रूप में निर्धारित किए जाएंगे। लेकिन मुझे अक्सर कुछ ट्यूटोरियल CUDA कोड मिलते हैं जिनमें प्रति ब्लॉक 1 थ्रेड के साथ कई ब्लॉक होते है

    6गर्मी

    1उत्तर

    के सदस्य फ़ंक्शन के रूप में मैं CUDA 5.0 और एक गणना क्षमता 2.1 कार्ड का उपयोग कर रहा हूं। प्रश्न काफी सरल है: क्या कर्नेल कक्षा का हिस्सा हो सकता है? उदाहरण के लिए: class Foo { private: //... publ

    6गर्मी

    3उत्तर

    मैं सीयूडीए को मौजूदा एकल थ्रेडेड सी प्रोग्राम में जोड़ने की कोशिश कर रहा हूं जो 90 के उत्तरार्ध में कभी-कभी लिखा गया था। ऐसा करने के लिए मुझे दो भाषाओं, सी और सी ++ (एनवीसीसी एक सी ++ कंपाइलर) मिश्रण

    5गर्मी

    2उत्तर

    cuLaunchKernel function के लिए एनवीडिया दस्तावेज के अनुसार, CUDA 3.2+ के साथ संकलित कर्नेल में उनकी पैरामीटर सूची के बारे में जानकारी होती है। क्या इस जानकारी को प्रोग्रामिंग रूप से एक क्यूफंक्शन हैंड

    5गर्मी

    1उत्तर

    पर H.264 वीडियो को एन्कोडिंग एफबीओ बनावट मैं एक ऐप लिखने की योजना बना रहा हूं जिसमें मुझे किसी दिए गए छवि अनुक्रम से वीडियो को एन्कोड करने की क्षमता की आवश्यकता है जो एक एफबीओ संलग्न बनावट से आता है।

    5गर्मी

    1उत्तर

    मैं कुडा के साथ नया हूं और सी के साथ वास्तव में परिचित नहीं हूं। मैंने अपने सी # प्रोग्राम में सीयूडीए विधियों (एफएफटी) को लागू करने के लिए एक डीएल लिखा था। मैंने पहले डीएल को एक कंसोल एप्लिकेशन के रू

    7गर्मी

    1उत्तर

    मुझे पता है कि "प्रत्येक वार में निरंतर धागे होते हैं, थ्रेड 0 युक्त पहले वार्प के साथ थ्रेड आईडी बढ़ते हैं" तो पहले 32 थ्रेड पहले वार में होना चाहिए। साथ ही मुझे पता है कि एक वार में सभी धागे किसी भी