sse

    7गर्मी

    2उत्तर

    मैं बाहर एक यथोचित तेज द्विरेखीय छानने समारोह सिर्फ एक नमूना फ़िल्टर किए गए के लिए एक समय में अब एक व्यायाम के रूप intrinsics का उपयोग कर के लिए इस्तेमाल किया जा रहा है में लगाने की कोशिश कर रहा हूँ -

    7गर्मी

    2उत्तर

    के साथ लगातार फ्लोट्स मैं माइक्रोसॉफ्ट के एसएसई इंट्रिनिक्स का उपयोग कर कुछ कोड को अनुकूलित करने के लिए अपना हाथ आजमा रहा हूं। मेरे कोड को अनुकूलित करते समय सबसे बड़ी समस्याओं में से एक एलएचएस होता है

    5गर्मी

    1उत्तर

    मैंने बस इस दिलचस्प लेख को पढ़ा है, Copying Accelerated Video Decode Frame Buffers। जहां वे बताते हैं कि यूएसडब्ल्यूसी मेमोरी से स्ट्रीमिंग लोड का उपयोग करके जितनी जल्दी हो सके कॉपी करना है। मेरा सवाल

    6गर्मी

    1उत्तर

    पर SSSE3 उपयोग नहीं कर सकते मैं एक जिऑन W3550 प्रोसेसर कि SSE4.2 अनुदेश सेट के लिए समर्थन करने के लिए माना जाता है, लेकिन जब मैं कोशिश करते हैं और मेरी ग कार्यक्रम में अतीत SSE2 कुछ भी का उपयोग मैं एक

    7गर्मी

    4उत्तर

    _mm_extract_psfloat के बजाय int क्यों लौटाता है? सी में एक्सएमएम रजिस्टर से एकल float पढ़ने का सही तरीका क्या है? या बल्कि, एक अलग तरह से यह पूछने के लिए है: _mm_set_ps अनुदेश के विपरीत क्या है?

    7गर्मी

    2उत्तर

    सी या सी ++ में आप जीसीसी द्वारा एक 128 बिट एसएसई हस्ताक्षरित अतिरिक्त निर्देश में ऑप्टिमाइज़ किए जाने वाले दो सरणी के हस्ताक्षरित जोड़े के लिए कोड कैसे लिखेंगे?

    22गर्मी

    1उत्तर

    मैं इंटेल डेटापत्रक देख रहा हूँ: इंटेल 64 और IA-32 आर्किटेक्चर सॉफ्टवेयर डेवलपर की मैनुअल और मैं के बीच अंतर नहीं मिल सकता है MOVDQA: ले जाएँ निरपेक्ष डबल Quadword MOVAPS: ले जाएँ निरपेक्ष मैं दोनों क

    8गर्मी

    2उत्तर

    मैं एकाधिक एसएसई संस्करणों में किसी एप्लिकेशन के प्रदर्शन की तुलना करना चाहता हूं और इस जेवीएम ध्वज द्वारा स्वीकार किए गए मानों को ढूंढने में असमर्थ रहा हूं। मैं 0, 1, 3, और 4 का परीक्षण कर रहा हूं। म

    6गर्मी

    2उत्तर

    मुझे समानता के लिए दो बफर खंड-वार की तुलना करने की आवश्यकता है। मुझे दो बफर के संबंध के बारे में जानकारी की आवश्यकता नहीं है, बस अगर प्रत्येक दो भाग बराबर हैं या नहीं। const size_t CHUNK_SIZE = 16; //

    6गर्मी

    2उत्तर

    का उपयोग करके सेगमेंटेशन गलती मैं कुछ एसएसई कोड में ओपनएमपी जोड़ने का प्रयोग शुरू कर रहा हूं। मेरा पहला टेस्ट प्रोग्राम SOMETIMES _mm_set_ps में क्रैश हो जाता है, लेकिन जब मैं if (0) सेट करता हूं तो क