neon

    8गर्मी

    2उत्तर

    हमारे पास एक एंड्रॉइड सीपीयू आश्रित कोड है और मैं देखना चाहता हूं कि ग्राहकों द्वारा कितने डिवाइस एआरएमवी 6/एआरएमवी 7 हैं, अगर अभी भी एआरएम वी 5 हैं, तो एआरएमवी 6 में कितने वीएफपी हैं, टेग्रा या नियॉन

    5गर्मी

    2उत्तर

    @ ऑसेलेन के उत्तर को यहां रेफर करना: Using ARM NEON intrinsics to add alpha and permute, ऐसा लगता है कि एनएनओएन अनुकूलन के लिए जीसीसी कंपाइलर की तुलना में armcc कंपाइलर कहीं अधिक बेहतर है। क्या यह वास

    6गर्मी

    4उत्तर

    चल बिंदु चर का एक बड़ा (~ 100 000) सरणी है, और वहाँ एक सीमा (भी बिंदु चल) है। समस्या यह है कि मुझे प्रत्येक एक चर को सरणी से सरणी से तुलना करना है, लेकिन नीयन झंडे स्थानांतरण वास्तव में एक लंबा समय ले

    5गर्मी

    3उत्तर

    के लिए समकक्ष विधि मैंने फास्ट कोनों के अनुकूलन को जारी रखने का फैसला किया और _mm_movemask_epi8 एसएसई निर्देश पर अटक गया। मैं uint8x16_t इनपुट के साथ एआरएम नियॉन के लिए इसे कैसे लिख सकता हूं?

    5गर्मी

    3उत्तर

    का उपयोग कर 128-बिट रोटेशन मैं नियॉन इंट्रिनिक्स का उपयोग करके अपना कोड अनुकूलित करने की कोशिश कर रहा हूं। मेरे पास 128-बिट सरणी (8 प्रत्येक uint16_t) पर 24-बिट रोटेशन है। यहाँ मेरी ग कोड है: uint16_t

    9गर्मी

    3उत्तर

    http://hilbert-space.de/?p=22 इस साइट जो काफी यह दिनांकित है पर पता चलता है कि हाथ से लिखा एएसएम एक बहुत बड़ी सुधार तो intrinsics देना होगा। मैं सोच रहा हूं कि 2012 में अब भी यह सच सच है। तो क्या संकल

    8गर्मी

    2उत्तर

    मैं नियॉन intrinsics का उपयोग कर एक अनुकूलित कोड में एक सी कोड को बदलने की कोशिश कर रहा हूँ। यहां सी कोड हैं जो ऑपरेटरों के वैक्टरों पर नहीं 2 ऑपरेटर संचालित करते हैं। uint16_t mult_z216(uint16_t a,ui

    8गर्मी

    1उत्तर

    मैं सीपीयू सुविधाओं पर थोड़ा सा सीख रहा हूं और नीयन पर ठोकर खा रहा हूं। जो मैंने पढ़ा है, ऐसा लगता है कि एनईओएन को इसका उपयोग करने के लिए विशिष्ट प्रोग्रामिंग की आवश्यकता है, लेकिन यह पूरी तरह से सच ह

    7गर्मी

    3उत्तर

    में 3 लेनों को सारांशित करना मैं एआरएम नियॉन इंट्रिनिक्स (एलएलवीएम, आईओएस) के साथ एक आंतरिक लूप को सदिश कर रहा हूं। मैं आम तौर पर float32x4_t एस का उपयोग कर रहा हूं। मेरी गणना इस वेक्टर में चार फ्लोट्

    17गर्मी

    3उत्तर

    मैं एंड्रॉइड फोन पर इस्तेमाल होने वाले सीपीयू को और समझना चाहता हूं। इसका कारण यह है कि हम सी लाइब्रेरी का निर्माण कर रहे हैं जिसमें कुछ सीपीयू/गणित प्रोसेसर आर्किटेक्चर झंडे हैं जिन्हें हम सेट कर सकत