sse

    6गर्मी

    1उत्तर

    मैं पैरामीटर एन के आधार पर xmm रजिस्टर के लिए विभिन्न movdqu निर्देश युक्त कोड उत्पन्न करने के लिए एक गैस मैक्रो लिखना चाहता हूं। .macro xxmov n, p1 .if (\n == 1) xor %eax, %eax .

    5गर्मी

    4उत्तर

    RGBA लिए आरजीबी परिवर्तित करने पर कुछ पिछले प्रश्नों के एक अनुवर्ती में, और ARGB लिए आरजीबी से रूपांतरण, मैं SSE साथ BGRA रूपांतरण के लिए एक आरजीबी तेजी लाने के लिए करना चाहते हैं। 32-बिट मशीन मानें,

    11गर्मी

    1उत्तर

    मुझे कुछ इंटेल एसएसई संचालन के नियॉन समकक्ष को समझने में कुछ परेशानी हो रही है। ऐसा लगता है कि नियॉन एक बार पूरे क्यू रजिस्टर को संभालने में सक्षम नहीं है (128 बिट मूल्य डेटा प्रकार)। मुझे arm_neon.h

    9गर्मी

    3उत्तर

    वेक्टरिंग पेड़ संचालन पर कुछ सामान्य सुझाव/पॉइंटर्स क्या हैं? मेमोरी लेआउट बुद्धिमान, एल्गोरिथ्म बुद्धिमान, आदि कुछ डोमेन विशिष्ट सामान: - बच्चे नोड्स प्रत्येक माता पिता नोड काफी कुछ (200 20) होगा। प्

    10गर्मी

    4उत्तर

    मैंने देखा है कि कभी-कभी एमएसवीसी 2010 एसएसई निर्देशों को फिर से व्यवस्थित नहीं करता है। मैंने सोचा कि मुझे अपने लूप के अंदर निर्देश आदेश की परवाह नहीं है क्योंकि संकलक सबसे अच्छा संभालता है, जो ऐसा न

    13गर्मी

    2उत्तर

    यह पोस्ट some days ago पर पोस्ट किए गए किसी अन्य से निकटता से संबंधित है। इस बार, मैंने एक साधारण कोड लिखा था जो तत्वों के सरणी की एक जोड़ी जोड़ता है, परिणाम को किसी अन्य सरणी में मानों से गुणा करता ह

    10गर्मी

    2उत्तर

    हालांकि मैंने इसके बारे में movntdqa निर्देशों के बारे में पढ़ा है, लेकिन कैश को प्रदूषित न करने के लिए मेमोरी रेंज को अक्षम करने या डेटा पढ़ने के लिए एक साफ तरीका निकाला है। मैं इसे जीसीसी से करना चा

    11गर्मी

    2उत्तर

    मैं कैसे परीक्षण करूं कि __m128i परिवर्तक एसएसई-2-और-पहले प्रोसेसर पर कोई nonzero मान है?

    8गर्मी

    2उत्तर

    मैं SSE2 intrinsics उपयोग कर रहा हूँ अपने आवेदन की बाधाओं का अनुकूलन और निम्नलिखित प्रश्न के लिए: ddata = _mm_xor_si128(_mm_xor_si128( _mm_sll_epi32(xdata, 0x7u), _mm_srl_epi32(tdata, 0x19u)), xda

    11गर्मी

    3उत्तर

    मैं एसएसई 4 के साथ __m128i ऑब्जेक्ट के साथ 16 हस्ताक्षरित 8 बिट पूर्णांक के साथ गुणा करना चाहता हूं, लेकिन मुझे केवल 16 बिट पूर्णांक गुणा करने के लिए एक आंतरिक मिल सकता है। क्या _mm_mult_epi8 जैसे कुछ