simd

10गर्मी

2उत्तर

क्या सीयूडीए सिम एक्सटेंशन का उपयोग कर सकता है?

मैं थोड़ा सा Google हूं, लेकिन यह अब मुझे स्पष्ट नहीं है कि क्या सीयूडीए के साथ प्रोग्राम किए गए कुछ जीपीयू लाभ ले सकते हैं या एसएसई सिम एक्सटेंशन से संबंधित निर्देशों का उपयोग कर सकते हैं; उदाहरण के

7गर्मी

2उत्तर

सिमड

के साथ लगातार फ्लोट्स मैं माइक्रोसॉफ्ट के एसएसई इंट्रिनिक्स का उपयोग कर कुछ कोड को अनुकूलित करने के लिए अपना हाथ आजमा रहा हूं। मेरे कोड को अनुकूलित करते समय सबसे बड़ी समस्याओं में से एक एलएचएस होता है

5गर्मी

4उत्तर

फास्ट vectorized बीजीआर को BGRA

RGBA लिए आरजीबी परिवर्तित करने पर कुछ पिछले प्रश्नों के एक अनुवर्ती में, और ARGB लिए आरजीबी से रूपांतरण, मैं SSE साथ BGRA रूपांतरण के लिए एक आरजीबी तेजी लाने के लिए करना चाहते हैं। 32-बिट मशीन मानें,

17गर्मी

3उत्तर

CUDA के लिए कोई लिस्प एक्सटेंशन?

मैंने अभी ध्यान दिया है कि डब्ल्यूडी हिलिस की कनेक्शन-मशीन के लिए पहली भाषाओं में से एक * लिस्प, समानांतर संरचनाओं के साथ आम लिस्प का विस्तार था। कनेक्शन-मशीन सिमड आर्किटेक्चर के साथ एक बड़े पैमाने पर

11गर्मी

1उत्तर

नीयन बनाम इंटेल एसएसई - कुछ परिचालनों के समतुल्य

मुझे कुछ इंटेल एसएसई संचालन के नियॉन समकक्ष को समझने में कुछ परेशानी हो रही है। ऐसा लगता है कि नियॉन एक बार पूरे क्यू रजिस्टर को संभालने में सक्षम नहीं है (128 बिट मूल्य डेटा प्रकार)। मुझे arm_neon.h

11गर्मी

1उत्तर

जीसीसी, सिमड इंट्रिनिक्स और फास्ट-गणित अवधारणाएं

हाय सब :) मैं फ्लोटिंग पॉइंट, सिमड/गणित इंट्रिनिक्स और जीसीसी के लिए फास्ट-मैथ फ्लैग के बारे में कुछ अवधारणाओं पर लटका पाने की कोशिश कर रहा हूं। अधिक विशेष रूप से, मैं x86 cpu पर gcc v4.5.0 के साथ Min

7गर्मी

4उत्तर

इंटेल एसएसई: 'फ्लोट` के बजाय `_mm_extract_ps` वापसी` int` क्यों करता है?

_mm_extract_psfloat के बजाय int क्यों लौटाता है? सी में एक्सएमएम रजिस्टर से एकल float पढ़ने का सही तरीका क्या है? या बल्कि, एक अलग तरह से यह पूछने के लिए है: _mm_set_ps अनुदेश के विपरीत क्या है?

6गर्मी

5उत्तर

सिमड सी ++ लाइब्रेरी

मैं डायरेक्टएक्स एक्सएनए गणित पुस्तकालय के साथ विजुअल स्टूडियो का उपयोग करता हूं। अब, मैं जीएनयू कंपाइलर संग्रह का उपयोग करता हूं। एक अच्छा दस्तावेज के साथ मुझे एक सिम गणित पुस्तकालय की सलाह दें।

8गर्मी

2उत्तर

जब मैं _mm_sfence _mm_lfence और _mm_mfence

का उपयोग करना चाहिए मैं "इंटेल अनुकूलन गाइड गाइड इंटेल वास्तुकला के लिए" पढ़ें। हालांकि, मैं अब भी के बारे में पता नहीं है जब मैं _mm_sfence() _mm_lfence() _mm_mfence() किसी ने मुझसे स्पष्टीकरण दे सकत

5गर्मी

1उत्तर

SSE (SIMD एक्सटेंशन) जीसीसी

में समर्थन मैं नीचे के रूप में एक कोड देखें:। #include "stdio.h" #define VECTOR_SIZE 4 typedef float v4sf __attribute__ ((vector_size(sizeof(float)*VECTOR_SIZE))); // vector of four single float