simd

    7गर्मी

    3उत्तर

    में 3 लेनों को सारांशित करना मैं एआरएम नियॉन इंट्रिनिक्स (एलएलवीएम, आईओएस) के साथ एक आंतरिक लूप को सदिश कर रहा हूं। मैं आम तौर पर float32x4_t एस का उपयोग कर रहा हूं। मेरी गणना इस वेक्टर में चार फ्लोट्

    42गर्मी

    3उत्तर

    OpenMP 4.0 "omp simd" नामक एक नया निर्माण प्रस्तुत करता है। पुराने "समांतर" पर इस निर्माण का उपयोग करने का क्या फायदा है? दूसरे पर एक बेहतर विकल्प कब होगा? संपादित करें: सिम निर्देश से संबंधित एक दिलच

    6गर्मी

    3उत्तर

    मैं एक परियोजना के लिए जीसीसी सिम वेक्टर एक्सटेंशन का उपयोग कर रहा हूं, सब कुछ काफी अच्छी तरह से काम करता है लेकिन रहता है, वे बस वेक्टर के सभी घटकों को रीसेट करते हैं। manual कहता है: यह एक से दूसरे

    5गर्मी

    1उत्तर

    हमें एसएसई/एवीएक्स के लिए गठबंधन स्मृति की आवश्यकता क्यों है? मुझे जो जवाब मिलता है वह एक गठबंधन है जो स्मृति लोड को असाइन किए गए मेमोरी लोड से बहुत तेज है। फिर, यह गठबंधन मेमोरी लोड असाइन किए गए मेमो

    9गर्मी

    3उत्तर

    मान लीजिए मैं दो बफ़र्स जोड़ सकते हैं और परिणाम संग्रहीत करना चाहते हैं। दोनों बफर पहले से ही 16byte गठबंधन आवंटित कर रहे हैं। मुझे दो उदाहरण मिलते हैं कि यह कैसे करें। पहले एक _mm_load उपयोग कर रहा ह

    5गर्मी

    2उत्तर

    @ ऑसेलेन के उत्तर को यहां रेफर करना: Using ARM NEON intrinsics to add alpha and permute, ऐसा लगता है कि एनएनओएन अनुकूलन के लिए जीसीसी कंपाइलर की तुलना में armcc कंपाइलर कहीं अधिक बेहतर है। क्या यह वास

    5गर्मी

    1उत्तर

    मैं सी में निम्नलिखित कोड को कैसे सिमडाइज़ कर सकता हूं (पाठ्यक्रम के सिमड इंट्रिनिक्स का उपयोग करके)? मैं SIMD intrinsics समझने में कोई परेशानी हो रहा है और यह एक बहुत मदद मिलेगी: int sum_naive(int n,

    5गर्मी

    1उत्तर

    मैं एसएसई इंट्रिनिक्स के लिए एक जोड़े रैपर कक्षाएं लिख रहा हूं - ज्यादातर प्रकार-सुरक्षित ज्यामिति संचालन प्राप्त करने के लिए, लेकिन कुछ सुविधा कार्यों को जोड़ने के लिए भी। मेरे सभी कार्य और ऑपरेटर इन

    16गर्मी

    3उत्तर

    मैं दो __m128 मानों को एक __m256 पर जोड़ना चाहता हूं। कुछ इस तरह: __m256 c = { 1, 2, 3, 4, 5, 6, 7, 8 }; किसी भी intrinsics है कि मैं यह करने के लिए उपयोग कर सकते हैं देखते हैं: __m128 a = _mm_set_p

    9गर्मी

    2उत्तर

    सिम और वेक्टर प्रोसेसर के बीच क्या अंतर है? मेरी वर्तमान समझ यह है कि वेक्टर प्रोसेसिंग सिम का सबसेट है। लेकिन मुझे बताया गया था कि "सिमड वैक्टरों तक ही सीमित नहीं है" और मुझे नहीं पता कि इसका क्या अर