intrinsics

    5गर्मी

    3उत्तर

    का उपयोग कर 128-बिट रोटेशन मैं नियॉन इंट्रिनिक्स का उपयोग करके अपना कोड अनुकूलित करने की कोशिश कर रहा हूं। मेरे पास 128-बिट सरणी (8 प्रत्येक uint16_t) पर 24-बिट रोटेशन है। यहाँ मेरी ग कोड है: uint16_t

    15गर्मी

    2उत्तर

    मैं के बारे में __noop पढ़ रहा था और MSDN उदाहरण #if DEBUG #define PRINT printf_s #else #define PRINT __noop #endif int main() { PRINT("\nhello\n"); } है और मैं सिर्फ एक खाली मैक

    7गर्मी

    3उत्तर

    में 3 लेनों को सारांशित करना मैं एआरएम नियॉन इंट्रिनिक्स (एलएलवीएम, आईओएस) के साथ एक आंतरिक लूप को सदिश कर रहा हूं। मैं आम तौर पर float32x4_t एस का उपयोग कर रहा हूं। मेरी गणना इस वेक्टर में चार फ्लोट्

    8गर्मी

    3उत्तर

    मेरे पास निम्न कोड है और उपयोग किए जाने वाले exp() फ़ंक्शन के आंतरिक संस्करण की अपेक्षा कर रहा हूं। दुर्भाग्य से, यह एक 64 निर्माण में नहीं है, यह एक ऐसी ही Win32 (यानी, 32-बिट का निर्माण) की तुलना मे

    5गर्मी

    2उत्तर

    मैं एमएस विजुअल स्टूडियो में एसएसई 2 निर्देश सेट के साथ काम कर रहा हूं। मैं 16-बिट डेटा के साथ कुछ गणना करने के लिए इसका उपयोग कर रहा हूं। मान लीजिए मेरे पास एसएसई रजिस्टर में 8 मान लोड हैं। मैं उन सभ

    10गर्मी

    2उत्तर

    क्या यह जांचने का कोई तरीका है कि __m128i चर में सभी बिट्स/बाइट्स/शब्द इत्यादि 0 हैं? मेरे ऐप में मुझे यह जांचना है कि __m128i चर में पैक किए गए सभी पूर्णांक शून्य हैं। क्या मुझे उन्हें निकालना होगा औ

    11गर्मी

    2उत्तर

    में स्कैटर इंट्रिनिक्स मैं उन्हें इंटेल इंट्रिनिक गाइड v2.7 में नहीं ढूंढ सकता। क्या आपको पता है कि AVX या AVX2 निर्देश सेट उन्हें समर्थन देते हैं?

    23गर्मी

    3उत्तर

    मैंने कई एसएसई कंपाइलर इंट्रिनिक्स का उपयोग करके एक 3 डी वेक्टर क्लास लिखा है। सब कुछ ठीक काम करता है जब तक कि मैंने 3 डी वेक्टर वाले वर्गों को नए के साथ सदस्य के रूप में स्थापित करना शुरू नहीं किया।

    5गर्मी

    1उत्तर

    मैं एसएसई इंट्रिनिक्स के लिए एक जोड़े रैपर कक्षाएं लिख रहा हूं - ज्यादातर प्रकार-सुरक्षित ज्यामिति संचालन प्राप्त करने के लिए, लेकिन कुछ सुविधा कार्यों को जोड़ने के लिए भी। मेरे सभी कार्य और ऑपरेटर इन

    8गर्मी

    1उत्तर

    एमएस विजुअल C++ SSE4.2 साथ CPUs पर popcnt शिक्षा का 2 जायके का समर्थन करता है: __popcnt() _mm_popcnt_u32() मैंने पाया फर्क सिर्फ इतना है कि __popcnt() के लिये दस्तावेज के रूप में चिह्नित कर रहे हैं कि