simd

7गर्मी

3उत्तर

में 3 लेनों को सारांशित करना मैं एआरएम नियॉन इंट्रिनिक्स (एलएलवीएम, आईओएस) के साथ एक आंतरिक लूप को सदिश कर रहा हूं। मैं आम तौर पर float32x4_t एस का उपयोग कर रहा हूं। मेरी गणना इस वेक्टर में चार फ्लोट्

42गर्मी

3उत्तर

बनाम omp simd के समानांतर: प्रत्येक का उपयोग कब करें?

OpenMP 4.0 "omp simd" नामक एक नया निर्माण प्रस्तुत करता है। पुराने "समांतर" पर इस निर्माण का उपयोग करने का क्या फायदा है? दूसरे पर एक बेहतर विकल्प कब होगा? संपादित करें: सिम निर्देश से संबंधित एक दिलच

6गर्मी

3उत्तर

जीसीसी में तैरने के लिए सिमड इंट वैक्टर को कैसे डाला जाए?

मैं एक परियोजना के लिए जीसीसी सिम वेक्टर एक्सटेंशन का उपयोग कर रहा हूं, सब कुछ काफी अच्छी तरह से काम करता है लेकिन रहता है, वे बस वेक्टर के सभी घटकों को रीसेट करते हैं। manual कहता है: यह एक से दूसरे

5गर्मी

1उत्तर

एसएसई वेक्टरेशन और मेमोरी संरेखण के बीच संबंध

हमें एसएसई/एवीएक्स के लिए गठबंधन स्मृति की आवश्यकता क्यों है? मुझे जो जवाब मिलता है वह एक गठबंधन है जो स्मृति लोड को असाइन किए गए मेमोरी लोड से बहुत तेज है। फिर, यह गठबंधन मेमोरी लोड असाइन किए गए मेमो

9गर्मी

3उत्तर

SSE: प्रत्यक्ष सूचक का उपयोग कर बनाम _mm_load/दुकान के बीच अंतर

मान लीजिए मैं दो बफ़र्स जोड़ सकते हैं और परिणाम संग्रहीत करना चाहते हैं। दोनों बफर पहले से ही 16byte गठबंधन आवंटित कर रहे हैं। मुझे दो उदाहरण मिलते हैं कि यह कैसे करें। पहले एक _mm_load उपयोग कर रहा ह

5गर्मी

2उत्तर

नीयन अनुकूलन के लिए कौन सा बेहतर, जीसीसी या armcc है?

@ ऑसेलेन के उत्तर को यहां रेफर करना: Using ARM NEON intrinsics to add alpha and permute, ऐसा लगता है कि एनएनओएन अनुकूलन के लिए जीसीसी कंपाइलर की तुलना में armcc कंपाइलर कहीं अधिक बेहतर है। क्या यह वास

5गर्मी

1उत्तर

निम्नलिखित कोड को सिम करें

मैं सी में निम्नलिखित कोड को कैसे सिमडाइज़ कर सकता हूं (पाठ्यक्रम के सिमड इंट्रिनिक्स का उपयोग करके)? मैं SIMD intrinsics समझने में कोई परेशानी हो रहा है और यह एक बहुत मदद मिलेगी: int sum_naive(int n,

5गर्मी

1उत्तर

मुझे अपने कार्यों/ऑपरेटरों को एसएसई डेटा कैसे पास करना चाहिए?

मैं एसएसई इंट्रिनिक्स के लिए एक जोड़े रैपर कक्षाएं लिख रहा हूं - ज्यादातर प्रकार-सुरक्षित ज्यामिति संचालन प्राप्त करने के लिए, लेकिन कुछ सुविधा कार्यों को जोड़ने के लिए भी। मेरे सभी कार्य और ऑपरेटर इन

16गर्मी

3उत्तर

दो __m128 मानों को __m256 में कैसे जोड़ें?

मैं दो __m128 मानों को एक __m256 पर जोड़ना चाहता हूं। कुछ इस तरह: __m256 c = { 1, 2, 3, 4, 5, 6, 7, 8 }; किसी भी intrinsics है कि मैं यह करने के लिए उपयोग कर सकते हैं देखते हैं: __m128 a = _mm_set_p

9गर्मी

2उत्तर

सिम बनाम वेक्टर आर्किटेक्चर

सिम और वेक्टर प्रोसेसर के बीच क्या अंतर है? मेरी वर्तमान समझ यह है कि वेक्टर प्रोसेसिंग सिम का सबसेट है। लेकिन मुझे बताया गया था कि "सिमड वैक्टरों तक ही सीमित नहीं है" और मुझे नहीं पता कि इसका क्या अर