नक्शा unordered_map से बहुत तेज़ क्यों होगा?

मैंने एक खोज कैशिंग परिणामों को लागू किया जिसमें प्रकार की कुंजी (7 शॉर्ट्स वाली कक्षा) और सोर्स (3 युगल का वर्ग) के मूल्य शामिल हैं। Unordered_map का उपयोग मानचित्र से कम से कम 20 गुना धीमा था। क्यूं कर?नक्शा unordered_map से बहुत तेज़ क्यों होगा?

संपादित करें: इसे हटाएं! मेरे हैश फंक्शन

namespace std { 
    size_t hash<State>::operator()(State const& s) const { 
     size_t retval = hash<short>()(s.s[0]); 
     for (int i = 1; i < R; i += 2) { // 1 3 5 
      int x = (static_cast<int>(s.s[i + 1]) << 16) 
       + (static_cast<int>(s.s[i])); 
      hash_combine(retval, x); 
     } 
    } 
}

मैं return retval करना भूल गया था, तो यह सब टकराने था! मेरी इच्छा है कि unordered_map में hash_function_quality() फ़ंक्शन था जो टकराव की औसत संख्या की रिपोर्ट करता है।

स्रोत

2011-01-31 Neil G

आपका एक्सेस पैटर्न क्या है? –

क्या मंच/कंपाइलर? – ThomasMcLeod

इंटेल i5, gcc, 600 हजार आवेषण और लुकअप –

unordered_map की गति आपके हैशिंग फ़ंक्शन की गति के लिए सीधे आनुपातिक है। यह कभी सीधा आगे संबंध नहीं है। बिंदु में प्रकरण, यदि आप सरल हैशिंग समारोह का उपयोग करें:

std::size_t myHash(MyObjectType _object){ return 1; }

एक संग्रह है जो एक टुकड़े किए गए कंटेनर के बजाय एक सूची की तरह बर्ताव करता है तो क्या आप के साथ खत्म हो जाएगा। सभी आइटम एक बाल्टी पर मैप किए जाएंगे और जब तक आप अपनी इच्छित वस्तु (कुछ ऐसा जो ओ (एन) समय ले सकता है, तब तक आपको पूरी बाल्टी को पार करना होगा।)

आपको क्या करना है दो चीजों पर:

आप किस हैशिंग फ़ंक्शन का उपयोग कर रहे हैं? क्या यह प्रक्रिया करने के लिए एक हास्यास्पद समय खर्च करता है?
यह कितने टकराव पैदा कर रहा है? यही है, एक ही हैश मूल्य में कितने अद्वितीय तत्व मैप किए जा रहे हैं?

इनमें से कोई भी प्रदर्शन कर सकता है और प्रदर्शन को मार देगा।

स्रोत

2011-01-31 01:25:27 wheaties

यह वह उत्तर है जिसने मुझे गलत बताया जा रहा है, इसलिए इसे स्वीकार कर रहा है। –

std::unordered_map हैश फ़ंक्शन की वजह से तत्वों की एक छोटी संख्या के लिए आमतौर पर धीमा होता है। यह एक निश्चित (-श) समय लेता है, लेकिन फिर भी समय की एक महत्वपूर्ण राशि हो सकती है।

std::map दूसरी तरफ std::unordered_map से सरल है। जिस समय यह तत्व का उपयोग करता है, वहां तत्वों की गिनती पर निर्भर करता है, लेकिन कम और कम इसलिए तत्वों की संख्या बढ़ जाती है। और बड़े-ओएच कारक c एक std :: मानचित्र के लिए आमतौर पर std::unordered_map की तुलना में बहुत छोटा है।

सामान्य रूप से, std::unordered_map से अधिक का उपयोग करना पसंद करें, जब तक आपके पास std::unordered_map का उपयोग करने का कोई विशिष्ट कारण न हो। यह विशेष रूप से रखता है यदि आपके पास बड़ी संख्या में तत्व नहीं हैं।

स्रोत

2011-01-31 01:16:36 wilhelmtell

यह मानना मुश्किल है कि एक हैश फ़ंक्शन बाइनरी पेड़ को ट्रांसवर्स करने से 20x अधिक समय लेगा। – ThomasMcLeod

@ थॉमस एमसीएलओड: ओपी ने उस पर किसी भी प्रकार का कोई विवरण नहीं दिया है। न केवल हैश फ़ंक्शन अपेक्षा से अधिक समय ले सकता है, बेवकूफ हैश फ़ंक्शन कई टकराव उत्पन्न कर सकता है। –

@ फ्रेड, मैं आपका अनुसरण नहीं करता "किसी भी प्रकार का विवरण नहीं।" हम पहुंच पैटर, सच याद कर रहे हैं। ठेठ टकराव मानते हैं, 20x समझ में नहीं आता है। – ThomasMcLeod

unordered_map हुड के नीचे एक हैश तालिका का उपयोग करता है, इसलिए हैश ने खराब प्रदर्शन क्यों किया है, इसलिए सबसे स्पष्ट कारण यह है कि आपके पास बहुत से टकराव हैं। आप विभिन्न, गैर-डिफ़ॉल्ट, हैश फ़ंक्शन का उपयोग करने पर विचार कर सकते हैं जो आपके प्रकार की चाबियों के लिए बेहतर परिणाम देगा।

स्रोत

2011-01-31 01:24:55

हाँ, आप सही थे। +1 –

लिए

काश unordered_map एक hash_function_quality() फ़ंक्शन कि रिपोर्ट टकराव की औसत संख्या थी।

मुझे लगता है कि निम्न कार्य उपयोगी हो सकता है।

unordered_map::load_factor 
    float load_factor() const; 
The member function returns the average number of elements per bucket.

लोअर load_factor, बेहतर हैश फंक्शन है।

स्रोत

2011-01-31 03:38:26 Arun

मैंने load_factor को देखा, लेकिन समस्या बाल्टी पर ई [तत्व] नहीं है, लेकिन ई [तत्व^2]। –

नक्शा unordered_map से बहुत तेज़ क्यों होगा?

उत्तर

संबंधित मुद्दे