मुझे एक प्रीकंप्यूटेड स्कोर द्वारा आदेशित लाखों आइटम मिल गए हैं। प्रत्येक आइटम में कई बुलियन गुण होते हैं। मान लें कि लगभग दस हजार संभावित गुण हैं, प्रत्येक आइटम में उनमें से दर्जन हैं।टैग खोज के लिए डेटास्टोर समाधान
मैं रीयलटाइम (कुछ मिलीसेकंड) में अनुरोध करने में सक्षम होना चाहता हूं, शीर्ष एन आइटम दिए गए ~ गुणों का कोई संयोजन।
आप किस समाधान की सिफारिश करेंगे? मैं कुछ बेहद स्केलेबल की तलाश में हूं।
-
- वर्तमान में हम MongoDB और सरणी सूचकांक पर देख रहे हैं, आप किसी भी सीमा देखते हैं?
- सोलर एक संभावित समाधान है लेकिन हमें टेक्स्ट खोज क्षमताओं की आवश्यकता नहीं है।
जब आप "स्कोर द्वारा क्रमबद्ध" कहते हैं तो क्या आपका मतलब है कि यह पहले से ही प्रीकंप्यूटेड है? यदि ऐसा है तो एसओएलआर कोई लाभ नहीं दे सकता है। यदि नहीं, तो एसओएलआर बहुत शक्तिशाली और अनुकूलन प्रासंगिकता रैंकिंग प्रदान करता है। – nickdos
लाखों आइटम एसओएलआर के लिए कोई समस्या नहीं है लेकिन 10,000 संभावित विशेषताओं _could_ एक समस्या है। एसओएलआर गतिशील क्षेत्रों का समर्थन करता है, इसलिए आपको सभी विशेषताओं को परिभाषित करने की आवश्यकता नहीं है लेकिन स्मृति व्यापक/स्पैस स्कीमा के साथ उड़ सकती है? अन्य इस पर सलाह देने में सक्षम हो सकते हैं। – nickdos
@nickdos हाँ स्कोर precomputed है। और मुझे लगता है कि आप सही हैं कि मुश्किल हिस्सा गुणों की बड़ी संख्या है। मुझे नहीं पता कि कैसे mongodb इसे संभालते हैं। क्या यह प्रति गुण एक सूचकांक बनाता है? क्या यह सूचकांक भी संभव है? हम वैसे भी परीक्षण करने जा रहे हैं लेकिन मैं यह सुनिश्चित करना चाहता हूं कि हम सही रणनीति को याद न करें। – log0