मैं कुछ अंतर्दृष्टि प्राप्त करना चाहता हूं कि निरंतर स्मृति आवंटित की जाती है (CUDA 4.2 का उपयोग करके)। मुझे पता है कि कुल उपलब्ध निरंतर स्मृति 64 केबी है। लेकिन यह स्मृति वास्तव में डिवाइस पर आवंटित
का उपयोग कर समस्या मैं लगातार स्मृति का उपयोग एक नमूना CUDA कोड तैयार किया है। मैं इसे सफलतापूर्वक cuda 4.2 में चला सकता हूं लेकिन मुझे "अमान्य डिवाइस प्रतीक" मिलता है जब मैं CUDA 5. का उपयोग करके संक
जब हम xptxas का उपयोग करके रजिस्टर के उपयोग की जांच हम कुछ इस तरह देखें: ptxas info : Used 63 registers, 244 bytes cmem[0], 51220 bytes cmem[2], 24 bytes cmem[14], 20 bytes cmem[16]
मुझे आश्चर्य है
का आउटपुट आउटपुट आउटपुट मैं हाथ से लिखित कर्नेल के लिए अपने प्रत्येक CUDA थ्रेड के लिए संसाधन उपयोग को समझने की कोशिश कर रहा हूं। मैं nvcc -arch=sm_20 -ptxas-options=-v के साथ एक kernel.o फाइल करने के
"CUDA C Programming Guide" के मुताबिक, एक मल्टीप्रोसेसर निरंतर कैश हिट होने पर निरंतर मेमोरी एक्सेस लाभ (धारा 5.3.2.4) । अन्यथा कोलेस्ड ग्लोबल मेमोरी पढ़ने के मामले में आधा-वार के लिए और भी मेमोरी अनु
में लगातार स्मृति उपयोग मैं इसे स्वयं नहीं समझ सकता, यह सुनिश्चित करने का सबसे अच्छा तरीका है कि मेरे कर्नेल में उपयोग की गई स्मृति स्थिर है। http://stackoverflow...r-pleasant-way पर एक समान प्रश्न है