simd

    10गर्मी

    2उत्तर

    मैं थोड़ा सा Google हूं, लेकिन यह अब मुझे स्पष्ट नहीं है कि क्या सीयूडीए के साथ प्रोग्राम किए गए कुछ जीपीयू लाभ ले सकते हैं या एसएसई सिम एक्सटेंशन से संबंधित निर्देशों का उपयोग कर सकते हैं; उदाहरण के

    7गर्मी

    2उत्तर

    के साथ लगातार फ्लोट्स मैं माइक्रोसॉफ्ट के एसएसई इंट्रिनिक्स का उपयोग कर कुछ कोड को अनुकूलित करने के लिए अपना हाथ आजमा रहा हूं। मेरे कोड को अनुकूलित करते समय सबसे बड़ी समस्याओं में से एक एलएचएस होता है

    5गर्मी

    4उत्तर

    RGBA लिए आरजीबी परिवर्तित करने पर कुछ पिछले प्रश्नों के एक अनुवर्ती में, और ARGB लिए आरजीबी से रूपांतरण, मैं SSE साथ BGRA रूपांतरण के लिए एक आरजीबी तेजी लाने के लिए करना चाहते हैं। 32-बिट मशीन मानें,

    17गर्मी

    3उत्तर

    मैंने अभी ध्यान दिया है कि डब्ल्यूडी हिलिस की कनेक्शन-मशीन के लिए पहली भाषाओं में से एक * लिस्प, समानांतर संरचनाओं के साथ आम लिस्प का विस्तार था। कनेक्शन-मशीन सिमड आर्किटेक्चर के साथ एक बड़े पैमाने पर

    11गर्मी

    1उत्तर

    मुझे कुछ इंटेल एसएसई संचालन के नियॉन समकक्ष को समझने में कुछ परेशानी हो रही है। ऐसा लगता है कि नियॉन एक बार पूरे क्यू रजिस्टर को संभालने में सक्षम नहीं है (128 बिट मूल्य डेटा प्रकार)। मुझे arm_neon.h

    11गर्मी

    1उत्तर

    हाय सब :) मैं फ्लोटिंग पॉइंट, सिमड/गणित इंट्रिनिक्स और जीसीसी के लिए फास्ट-मैथ फ्लैग के बारे में कुछ अवधारणाओं पर लटका पाने की कोशिश कर रहा हूं। अधिक विशेष रूप से, मैं x86 cpu पर gcc v4.5.0 के साथ Min

    7गर्मी

    4उत्तर

    _mm_extract_psfloat के बजाय int क्यों लौटाता है? सी में एक्सएमएम रजिस्टर से एकल float पढ़ने का सही तरीका क्या है? या बल्कि, एक अलग तरह से यह पूछने के लिए है: _mm_set_ps अनुदेश के विपरीत क्या है?

    6गर्मी

    5उत्तर

    मैं डायरेक्टएक्स एक्सएनए गणित पुस्तकालय के साथ विजुअल स्टूडियो का उपयोग करता हूं। अब, मैं जीएनयू कंपाइलर संग्रह का उपयोग करता हूं। एक अच्छा दस्तावेज के साथ मुझे एक सिम गणित पुस्तकालय की सलाह दें।

    8गर्मी

    2उत्तर

    का उपयोग करना चाहिए मैं "इंटेल अनुकूलन गाइड गाइड इंटेल वास्तुकला के लिए" पढ़ें। हालांकि, मैं अब भी के बारे में पता नहीं है जब मैं _mm_sfence() _mm_lfence() _mm_mfence() किसी ने मुझसे स्पष्टीकरण दे सकत

    5गर्मी

    1उत्तर

    में समर्थन मैं नीचे के रूप में एक कोड देखें:। #include "stdio.h" #define VECTOR_SIZE 4 typedef float v4sf __attribute__ ((vector_size(sizeof(float)*VECTOR_SIZE))); // vector of four single float