sse

    11गर्मी

    1उत्तर

    मैं कुछ समय के लिए एक विशेष एप्लिकेशन को सदिश बनाने के लिए संघर्ष कर रहा हूं और मैंने सब कुछ करने की कोशिश की है। स्वचालन से, एसएसई intrinsics handcoded करने के लिए। लेकिन किसी भी तरह से मैं अपने स्टे

    11गर्मी

    2उत्तर

    पर एसएसई 2 का उपयोग करके ओवरफ़्लो के बिना हस्ताक्षरित बाइट्स की कुल कमी, मैं इंटेल i3 प्रोसेसर पर 32 तत्वों (प्रत्येक 1 बाइट डेटा) की कुल कमी को खोजने का प्रयास कर रहा हूं। मैंने यह किया: s=0; for (i

    14गर्मी

    2उत्तर

    के लिए इंटेल एसएसई इंट्रिनिक्स का उपयोग कर कोड अनुकूलित करना यह मेरा पहला समय एसएसई इंट्रिनिक्स के साथ काम कर रहा है। मैं इंटेल एसएसई आंतरिक (एसएसई 4.2 तक) का उपयोग कर कोड के एक साधारण टुकड़े को एक ते

    9गर्मी

    3उत्तर

    मान लीजिए मैं दो बफ़र्स जोड़ सकते हैं और परिणाम संग्रहीत करना चाहते हैं। दोनों बफर पहले से ही 16byte गठबंधन आवंटित कर रहे हैं। मुझे दो उदाहरण मिलते हैं कि यह कैसे करें। पहले एक _mm_load उपयोग कर रहा ह

    6गर्मी

    1उत्तर

    के कारण एसएसई इंट्रिनिक्स के साथ काम करते समय सेगमेंटेशन गलती मैं पहली बार एसएसई इंट्रिनिक्स के साथ काम कर रहा हूं और मुझे 16byte मेमोरी संरेखण सुनिश्चित करने के बाद भी सेगमेंटेशन गलती का सामना करना प

    8गर्मी

    1उत्तर

    एमएस विजुअल C++ SSE4.2 साथ CPUs पर popcnt शिक्षा का 2 जायके का समर्थन करता है: __popcnt() _mm_popcnt_u32() मैंने पाया फर्क सिर्फ इतना है कि __popcnt() के लिये दस्तावेज के रूप में चिह्नित कर रहे हैं कि

    16गर्मी

    3उत्तर

    मैं दो __m128 मानों को एक __m256 पर जोड़ना चाहता हूं। कुछ इस तरह: __m256 c = { 1, 2, 3, 4, 5, 6, 7, 8 }; किसी भी intrinsics है कि मैं यह करने के लिए उपयोग कर सकते हैं देखते हैं: __m128 a = _mm_set_p

    10गर्मी

    4उत्तर

    साथ कोड लाइन मैं निम्नलिखित समारोह (opensource परियोजना "recast navigation" से) है: /// Derives the dot product of two vectors on the xz-plane. (@p u . @p v) /// @param[in] u A vector [(x, y, z)]

    8गर्मी

    2उत्तर

    मैं नियॉन intrinsics का उपयोग कर एक अनुकूलित कोड में एक सी कोड को बदलने की कोशिश कर रहा हूँ। यहां सी कोड हैं जो ऑपरेटरों के वैक्टरों पर नहीं 2 ऑपरेटर संचालित करते हैं। uint16_t mult_z216(uint16_t a,ui

    10गर्मी

    3उत्तर

    का उपयोग करते हुए वेक्टरिंग डॉट उत्पाद गणना वे एसएसई 4 डॉट उत्पाद के साथ इस कोड को बेहतर बनाने की कोशिश कर रहे हैं लेकिन मुझे समाधान खोजने में कठिनाई हो रही है। यह फ़ंक्शन पैरामीटर क्यूई और टीजे प्राप