sse

    9गर्मी

    3उत्तर

    के बिना जीसीसी के साथ एसएसई निर्देशों का उपयोग करना मुझे जीसीसी के साथ x86-64 के एसएसई वेक्टर निर्देशों का उपयोग करने में दिलचस्पी है और इसके लिए किसी भी इनलाइन असेंबली का उपयोग नहीं करना चाहते हैं। क

    10गर्मी

    2उत्तर

    पर पढ़ा गया है, मुझे परमाणु रूप से 16 बाइट पढ़ने/लिखने की आवश्यकता है। मैं केवल cmpxchg16 का उपयोग करके लेखन करता हूं, जो सभी x64 प्रोसेसर पर उपलब्ध है, सिवाय इसके कि मैं एक अस्पष्ट एएमडी के लिए सोचता

    6गर्मी

    1उत्तर

    कैसे परिवर्तित करें __int64 मान को __m64 एसएसई के साथ उपयोग के लिए मूल्य बदलने के लिए उचित तरीका क्या है?

    7गर्मी

    2उत्तर

    मैं एक गणना-गहन एल्गोरिदम अनुकूलित करने की कोशिश कर रहा हूं और कुछ कैश समस्या पर फंस गया हूं। मेरे पास एक बड़ा बफर है जो कभी-कभी और यादृच्छिक रूप से लिखा जाता है और एप्लिकेशन के अंत में केवल एक बार पढ

    12गर्मी

    4उत्तर

    मैंने अभी एसएसई का उपयोग करना शुरू कर दिया है और मैं उलझन में हूं कि __m128i के अधिकतम पूर्णांक मान (max) को कैसे प्राप्त करें। उदाहरण के लिए: __m128i t = _mm_setr_ps(0,1,2,3); // max(t) = 3; आसपास

    6गर्मी

    3उत्तर

    इंटेल कंपाइलर इंट्रिनिक्स के साथ, 128-बिट रजिस्टर दिए गए, 8 16-बिट तत्वों को पैक करते हुए, मैं पंजीकरण के भीतर से (सस्ते) मनमानी तत्वों को कैसे एक्सेस करूं? _mm_cvtepi8_epi64 के बाद के उपयोग (हस्ताक्ष

    6गर्मी

    1उत्तर

    gcc का नाम __m256 और __m256i (AVX निर्देश सेट) की तुलना करने के लिए आंतरिक क्या है?

    7गर्मी

    2उत्तर

    मुझे एक __m128i चर के फ़ंक्शन की आवश्यकता है जिसमें अवधि 2^128 है। इसे एकान्त रूप से बढ़ने की आवश्यकता नहीं है (काउंटर की तरह), लेकिन एक बार प्रत्येक मान पर जाएं। सबसे सरल उदाहरण मैं वास्तव में 128-बि

    12गर्मी

    1उत्तर

    पर एक्सएमएम रजिस्टर से पैक किए गए डबलवर्ड पूर्णांक को धक्का देने का कोई तरीका है? और फिर बाद में जरूरत पड़ने पर इसे वापस पॉप पर? आदर्श रूप में मैं PUSH या सामान्य प्रयोजन रजिस्टरों के लिए पॉप की तरह क

    6गर्मी

    1उत्तर

    के लिए जोड़ें I vector intrinsics का उपयोग करके मेरी व्यक्तिगत छवि प्रसंस्करण लाइब्रेरी को फिर से लिखकर सिम क्षमताओं का उपयोग करना सीख रहा हूं। एक बुनियादी कार्य एक सरल "सरणी +=," यानी void arrayAdd(u