2012-10-28 20 views
7

क्या कोड को फिर से लिखना समझ में आता है ताकि यह डेटा गंध बनावट कैश लोड कर सके (मान लीजिए कि मुझे फ़िल्टरिंग और अन्य बनावट इकाई विकल्पों की आवश्यकता नहीं है) या यह वही है? कुछ डेटा गड़बड़ी L1 कैश और कुछ गंध texturing इकाई लोड करने के बारे में कैसे? मेरे पास एक कोड है जहां मैं ऐसी रणनीति का उपयोग कर सकता हूं लेकिन क्या यह बिल्कुल समझ में आता है?CUDA: क्या एल 1 कैश से अलग FERMI पर बनावट कैश है?

यह स्पष्ट करने के लिए, मेरा मतलब है, "F1MI पर बनावट कैश एल 1 कैश हार्डवेयर से अलग हार्डवेयर है" - दूसरे शब्दों में, क्या मैं अपने कोड के लिए पूरी तरह से L1 + बनावट कैश वॉल्यूम प्राप्त कर सकता हूं?

उत्तर

11

यह अलग है। एक बनावट भार एल 1 के माध्यम से नहीं जाता है। गैर बनावट अनुप्रयोगों (यानी आप इंटरपोलेशन और क्लैंपिंग जैसी सुविधाओं का उपयोग नहीं कर रहे हैं) के लिए टेक्स्टिंग का मुख्य लाभ यह है कि यह आपको चुनिंदा रूप से बड़ी मात्रा में वैश्विक मेमोरी जोड़ने की अनुमति देता है जिसे बिना किसी बाधा के संभावित रूप से कैश किया जा सकता है (स्थानीयता और पुन: उपयोग करना) एल 1 में क्या चल रहा है। छोटे डेटा सेट के लिए, टेक्स्टिंग एल 1 की तुलना में बेहतर perf नहीं देगा। बड़े डेटा सेट के लिए, जहां कुछ इलाके और पुन: उपयोग किया जाता है, लेकिन बनावट कैश द्वारा कवर किए गए क्षेत्र से लोड अन्यथा एल 1 को फेंक सकता है (जो कि कैश कॉन्फ़िगरेशन के आधार पर फर्मि पर प्रति एसएम 16 केबी जितना छोटा हो सकता है) बनावट कैश समग्र रूप से आवेदन को लाभ प्रदान कर सकता है। उपयोगकर्ताओं के अनुभव के लिए यह असामान्य नहीं है कि बनावट का उपयोग करना उतना तेज़ नहीं है जितना कि चीजों को एल 1 में कैश किया जा सकता है, लेकिन अनचाहे भार से बहुत तेज़, या एल 1 को फेंकने वाले बिखरे हुए भार। बहुत से उपयोग पैटर्न और आकार के आकार पर निर्भर करेगा। बनावट कैश का आकार प्रति एसएम 8 केबी के क्रम पर है। आप एक बहुत बड़े क्षेत्र को कैश कर सकते हैं, लेकिन उच्च स्तर का पुन: उपयोग और इलाके निश्चित रूप से बनावट कैश के प्रदर्शन में सुधार करेगा। यह भी ध्यान रखें कि बनावट स्मृति केवल पढ़ने के लिए है। आपको इस webinar में रुचि हो सकती है।

+0

बिल्कुल वही जवाब जो मैं ढूंढ रहा था, धन्यवाद। –