ट्राई इस तरह की खोज की पहली डेटा संरचना थी।
प्रत्यय पेड़ त्रिभुज में सुधार है (इसमें प्रत्यय लिंक हैं जो रैखिक त्रुटि खोज की अनुमति देते हैं, प्रत्यय पेड़ त्रिभुज की अनावश्यक शाखाओं को ट्रिम करता है इसलिए इसे अधिक जगह की आवश्यकता नहीं होती है)।
प्रत्यय सरणी प्रत्यय पेड़ (कोई प्रत्यय लिंक (धीमी त्रुटि मिलान) के आधार पर एक अलग डेटा संरचना है, फिर भी पैटर्न मिलान बहुत तेज है)।
त्रिभुज वास्तविक दुनिया के उपयोग के लिए नहीं है क्योंकि यह बहुत अधिक जगह का उपभोग करता है।
प्रत्यय पेड़ त्रिभुज से तेज और तेज़ है और इसका उपयोग डीएनए को इंडेक्स करने या कुछ बड़े वेब सर्च इंजनों को अनुकूलित करने के लिए किया जाता है।
प्रत्यय सरणी प्रत्यय पेड़ की तुलना में कुछ पैटर्न खोजों में धीमी है लेकिन कम जगह का उपयोग करती है, और अधिक व्यापक रूप से प्रत्यय के पेड़ की तुलना में उपयोग की जाती है।
डेटा संरचनाओं की एक ही परिवार में:
अन्य कार्यान्वयन कर रहे हैं, सीएसटी एक प्रत्यय सरणी और कुछ अतिरिक्त डेटा संरचनाओं का उपयोग कर प्रत्यय पेड़ खोज क्षमताओं में से कुछ पाने के लिए प्रत्यय के पेड़ के एक कार्यान्वयन है।
एफसीएसटी इसे आगे ले जाता है, यह एक प्रत्यय सरणी के साथ एक नमूना प्रत्यय पेड़ लागू करता है।
डीएफसीएसटी एफसीएसटी का गतिशील संस्करण है।
विस्तार करना:
दो महत्वपूर्ण कारकों अंतरिक्ष उपयोग और संचालन निष्पादन समय कर रहे हैं। आपको लगता है कि आधुनिक दिन मशीनों के साथ यह प्रासंगिक नहीं है लेकिन एक इंसान के डीएनए को इंडेक्स करने के लिए 40 गीगाबाइट मेमोरी की आवश्यकता होगी (एक असम्पीडित और अपरिवर्तित प्रत्यय पेड़ का उपयोग करके)। और इस सूचकांक में से एक को इस डेटा में बनाने के लिए दिन लग सकते हैं। Google की कल्पना करें, इसमें बहुत सारे खोज योग्य डेटा हैं, उन्हें सभी वेब डेटा पर एक बड़ी अनुक्रमणिका की आवश्यकता है और जब भी कोई कोई वेब पेज बनाता है तो वे इसे नहीं बदलते हैं। उनके पास कैशिंग का कुछ रूप है। हालांकि मुख्य सूचकांक शायद स्थिर है। और हर हफ्ते या तो वे सभी नई वेब साइट्स और डेटा इकट्ठा करते हैं और एक नया इंडेक्स बनाते हैं, जब नया समाप्त हो जाता है तो पुराने को बदल दिया जाता है। मुझे नहीं पता कि वे कौन से एल्गोरिदम का उपयोग इंडेक्स में करते हैं, लेकिन शायद यह एक विभाजन डेटाबेस पर प्रत्यय वृक्ष गुणों के साथ एक प्रत्यय सरणी है।
सीएसटी 8 गीगाबाइट का उपयोग करता है, हालांकि प्रत्यय पेड़ संचालन की गति बहुत कम हो जाती है।
प्रत्यय सरणी कुछ 700 मेगास में 2 गीगा में भी ऐसा ही कर सकती है। हालांकि आपको डीएनए में एक प्रत्यय सरणी के साथ अनुवांशिक त्रुटियां नहीं मिलेंगी (अर्थात्: वाइल्डकार्ड के साथ पैटर्न की खोज करना बहुत धीमा है)।
एफसीएसटी (पूरी तरह संपीड़ित प्रत्यय पेड़) 800 से 1.5 गीगा में एक प्रत्यय पेड़ बना सकता है। सीएसटी की ओर एक छोटी सी गति में गिरावट के साथ।
डीएफसीएसटी एफसीएसटी की तुलना में 20% अधिक स्थान का उपयोग करता है, और एफसीएसटी के स्थिर कार्यान्वयन की गति को खो देता है (हालांकि गतिशील सूचकांक बहुत महत्वपूर्ण है)।
प्रत्यय पेड़ के कई व्यवहार्य (स्पेस वार) कार्यान्वयन नहीं हैं क्योंकि ऑपरेशन की गति को डेटा संरचनाओं को रैम स्पेस लागत की क्षतिपूर्ति करना बहुत मुश्किल है।
यह कहा गया है कि प्रत्यय पेड़ त्रुटियों के साथ मिलान पैटर्न के लिए बहुत ही रोचक खोज परिणाम है। अहो कोरसिक तेज़ नहीं है (हालांकि लगभग कुछ परिचालनों के लिए तेज़, त्रुटि मिलान नहीं) और बॉयर मूर धूल में छोड़ा गया है।
संचालन के लिए सर्वश्रेष्ठ प्रदर्शन? –