sse

    10गर्मी

    5उत्तर

    मैं खुले स्रोत (लाइसेंस पर कोई प्रतिबंध नहीं) लॉग समारोह के कार्यान्वयन, हस्ताक्षर के साथ कुछ __m128d _mm_log_pd(__m128d); यह इंटेल लघु वेक्टर गणित लाइब्रेरी (आईसीसी का हिस्सा) में उपलब्ध है की जरूर

    6गर्मी

    3उत्तर

    मैं एक 4 डी वेक्टर सामान्य करने की कोशिश कर रहा हूं। मेरा पहला दृष्टिकोण एसएसई इंट्रिनिक्स का उपयोग करना था - कुछ ऐसा जो मेरे वेक्टर अंकगणित में 2 गुना गति प्रदान करता था। यहाँ बुनियादी कोड है: (v.v4

    5गर्मी

    1उत्तर

    मुझे आश्चर्य है कि एमएक्ससीएसआर नियंत्रण रजिस्टर (एफटीजेड और डीएजेड कॉन्फ़िगरेशन सहित डिमॉर्मल फ्लोटिंग-पॉइंट नंबरों के लिए) में संग्रहीत मूल्य का जीवनकाल क्या है: क्या यह थ्रेड के दायरे में है, या यह

    8गर्मी

    2उत्तर

    का उपयोग करना चाहिए मैं "इंटेल अनुकूलन गाइड गाइड इंटेल वास्तुकला के लिए" पढ़ें। हालांकि, मैं अब भी के बारे में पता नहीं है जब मैं _mm_sfence() _mm_lfence() _mm_mfence() किसी ने मुझसे स्पष्टीकरण दे सकत

    11गर्मी

    4उत्तर

    मैं एसएसई (2/3) रजिस्टरों में संकलन समय निरंतर फ्लोट लोड करने का एक प्रभावी तरीका जानने का प्रयास कर रहा हूं। मैंने इस तरह के सरल कोड करने की कोशिश की है, const __m128 x = { 1.0f, 2.0f, 3.0f, 4.0f };

    5गर्मी

    1उत्तर

    में समर्थन मैं नीचे के रूप में एक कोड देखें:। #include "stdio.h" #define VECTOR_SIZE 4 typedef float v4sf __attribute__ ((vector_size(sizeof(float)*VECTOR_SIZE))); // vector of four single float

    8गर्मी

    2उत्तर

    मेरी परियोजना में मैंने मूल श्रेणी सीवीक्टर लागू किया है। इस वर्ग में कच्चे फ़्लोटिंग पॉइंट सरणी के लिए फ्लोट * पॉइंटर शामिल है। यह सरणी मानक malloc() फ़ंक्शन का उपयोग करके गतिशील रूप से आवंटित की जात

    10गर्मी

    2उत्तर

    मैं थोड़ा सा Google हूं, लेकिन यह अब मुझे स्पष्ट नहीं है कि क्या सीयूडीए के साथ प्रोग्राम किए गए कुछ जीपीयू लाभ ले सकते हैं या एसएसई सिम एक्सटेंशन से संबंधित निर्देशों का उपयोग कर सकते हैं; उदाहरण के

    5गर्मी

    2उत्तर

    मैं एसएसई इंट्रिनिक्स का उपयोग करके अपना कोड अनुकूलित करने की कोशिश कर रहा हूं लेकिन एक समस्या में भाग रहा हूं जहां मुझे एसईएस इंट्रिनिक्स ऑपरेशंस करने के बाद वेक्टर से पूर्णांक मान निकालने का एक अच्छ

    12गर्मी

    2उत्तर

    द्वारा संरेखित प्रकार और गुजरने वाले तर्क मूल्य से गठबंधन प्रकारों के साथ गठबंधन प्रकार या संरचनाओं को पास करना कुछ कार्यान्वयन के साथ काम नहीं करता है। यह एसटीएल कंटेनर तोड़ता है, क्योंकि कुछ विधियों