openmp

    6गर्मी

    1उत्तर

    हम एक सी ++ 11 परियोजना जहाँ हम OpenMP का उपयोग हमारी गणना तेजी लाने के लिए पर Xcode 4.5 का उपयोग कर रहे उपयोग करता पता चलता है एक से अधिक थ्रेड कार्यक्रम हमने देखा द्वारा किया जा रहा है कि केवल एक को

    6गर्मी

    1उत्तर

    मेरे पास फोरट्रान में एक कोड है जो एमकेएल से DGESVD का उपयोग करता है और इंटेल कंपाइलर के साथ 8 कोर पर चलता है। ओपनएमपी के माध्यम से कोड तेज हो गया है। इसके अलावा मुझे पता है कि ओपनएमपी और एमकेएल की धा

    42गर्मी

    3उत्तर

    OpenMP 4.0 "omp simd" नामक एक नया निर्माण प्रस्तुत करता है। पुराने "समांतर" पर इस निर्माण का उपयोग करने का क्या फायदा है? दूसरे पर एक बेहतर विकल्प कब होगा? संपादित करें: सिम निर्देश से संबंधित एक दिलच

    6गर्मी

    1उत्तर

    मैं --physcpubind विकल्प के साथ numactl का उपयोग कर रहा था। मैनुअल का कहना है: --physcpubind=cpus, -C cpus Only execute process on cpus. Etc... मान लीजिए कि मैं 3 NUMA नोड्स, जहां उनमें से प्रत्येक

    16गर्मी

    4उत्तर

    लिखने की थ्रेड-सुरक्षा मैंने on Stackoverflow पढ़ा है कि एसटीएल कंटेनर में से कोई भी लिखने के लिए थ्रेड-सुरक्षित नहीं है। लेकिन अभ्यास में इसका क्या अर्थ है? क्या इसका मतलब है कि मुझे सादे सरणी में लि

    6गर्मी

    4उत्तर

    रोकता है मैं अपने कोड को जीसीसी द्वारा ऑटो वेक्टरिज्ड करने में सक्षम बनाने के लिए काम कर रहा हूं, हालांकि, जब मैं -fopenmp ध्वज शामिल करता हूं तो ऐसा लगता है कि यह ऑटो वेक्टरिसेशन पर सभी प्रयासों को र

    6गर्मी

    3उत्तर

    मैं समझता हूं कि ओपनएमपी वास्तव में केवल मैक्रोज़ का एक सेट है जो पठ्रेड में संकलित है। शेष संकलन होने से पहले पर्थ्रेड कोड देखने का कोई तरीका है? मैं संकलन करने के लिए जीसीसी का उपयोग कर रहा हूँ।

    7गर्मी

    2उत्तर

    बहु-थ्रेड प्रोग्रामिंग के लिए, एचपीसी एप्लिकेशन (एमपीआई) के साथ संयोजनों के विचारों के साथ, कौन सा बेहतर है, क्या हम कार्यक्षमता के मामले में इंटेल टीबीबी (थ्रेड बिल्डिंग ब्लॉक) को पठित करने के लिए तु

    5गर्मी

    1उत्तर

    का उपयोग कर एफएफटीडब्ल्यू योजना निर्माण मैं समानांतर में कई एफएफटी करने की कोशिश कर रहा हूं। मैं एफएफटीडब्ल्यू और ओपनएमपी का उपयोग कर रहा हूं। प्रत्येक एफएफटी अलग है, इसलिए मैं एफएफटीडब्ल्यू के बिल्ड-

    10गर्मी

    2उत्तर

    में साझा किया जाना चाहिए या नहीं, मेरे पास एक लूप है जो मैट्रिक्स ए अपडेट करता है और मैं इसे openmp बनाना चाहता हूं लेकिन मुझे यकीन नहीं है कि कौन से चर साझा किए जाने चाहिए और निजी। मैंने सोचा होगा कि