2012-10-19 39 views
6

हमें अभी सीयूडीए 5 का स्थिर संस्करण प्राप्त हुआ है। केपलर जैसे कुछ नए शब्द और बेहतर प्रदर्शन के साथ एमपीआई का उपयोग करने की क्षमता और 32 अनुप्रयोगों के साथ एक ही कार्ड चलाना एक ही समय में। मैं थोड़ा उलझन में हूं और ऐसे प्रश्नों के उत्तर की तलाश में हूं:सीयूडीए 5 की विशेषताओं का पूरी तरह से उपयोग करने के लिए कौन से कार्ड और गणना क्षमताओं की आवश्यकता है

  • सीयूडीए 5 की सुविधाओं का पूरी तरह से उपयोग करने के लिए कौन से कार्ड और गणना क्षमताओं की आवश्यकता है?
  • क्या नई विशेषताएं केवल केप्लर आर्किटेक्चर के लिए उपलब्ध हैं, जैसे GPUDirect, गतिशील समांतरता, हाइपर क्यू और गतिशील समांतरता।
  • यदि हमारे पास फर्मि आर्किटेक्चर हैं, तो CUDA 5 का उपयोग करने के क्या फायदे हैं। क्या यह लिनक्स और ग्रहण पर एनएसइट का उपयोग करने की क्षमता के अलावा लाभ लाता है। मुझे लगता है कि लाइब्रेरी बनाने की क्षमता सबसे महत्वपूर्ण विशेषता है?
  • तुम सिर्फ CUDA 4 से CUDA 5. को पास करके किसी भी प्रदर्शन में सुधार देखा था

मैं

हालांकि एक बेहतर, संक्षिप्त वर्णन हमारे दिमाग को स्पष्ट कर सकता है।

पीएस: कृपया उपरोक्त प्रश्नों के उत्तर को सीमित न करें। मुझे कुछ समान प्रश्न याद आ रहे हैं।

उत्तर

5

गणना क्षमता 3.5 (उदाहरण के लिए जीके 110) गतिशील समांतरता के लिए आवश्यक है क्योंकि पहले जीपीयू में धागे के लिए कर्नेल लॉन्च करने के लिए आवश्यक हार्डवेयर नहीं होता है या हार्डवेयर कमांड कतार में अन्य एपीआई कॉल सीधे इंजेक्ट नहीं किया जाता है।

हाइपर-क्यू के लिए गणना क्षमता 3.5 आवश्यक है।

SHFL intrinsics सीसी 3.0 (GK104)

डिवाइस कोड जोड़ने, Nsight ईई, nvprof, प्रदर्शन में सुधार और बग फिक्स CUDA 5 लाभ फर्मी और पहले GPUs में आवश्यकता होती है।

+0

क्या जीके 110 वैश्विक रूप से जारी किया गया है? इस कोडनाम के साथ कौन से कार्ड भेजे गए? – ahmad

+0

@ अहमद: हार्डवेयर अभी तक सार्वजनिक रूप से उपलब्ध नहीं है। – talonmies

+0

उत्पादों के टेस्ला परिवार में जीके 110 का उपयोग करने वाले उत्पादों में से एक [के 20] (http://www.nvidia.com/content/tesla/pdf/NV_DS_TeslaK_Family_May_2012_LR.pdf) है। –