मूल प्रश्न को फ़ाइल दिया गया है जिसमें पिछले दिन 5 जीबी यूआरएल देखा जा रहा है, शीर्ष के लगातार यूआरएल खोजें। समस्या को अलग-अलग यूआरएल की घटनाओं की गिनती करने के लिए हैश मानचित्र का उपयोग करके हल किया जा सकता है और ओ (एन लॉग के) समय लेते हुए, न्यूनतम ढेर की मदद से शीर्ष के को ढूंढ सकता है।अंतिम दिन, या अंतिम घंटा, या अंतिम मिनट के लिए शीर्ष पर जाने वाले यूआरएल खोजें?
अब मैं सोच रहा हूं कि इनपुट असीमित ऑनलाइन डेटा स्ट्रीम (स्थिर फ़ाइल के बजाय) था, तो मैं अंतिम दिन के शीर्ष के यूआरएल को कैसे जान सकता हूं?
या क्या कोई ऐसा सुधार है जो मैं सिस्टम में कर सकता हूं जो मुझे अंतिम मिनट और अंतिम दिन और अंतिम घंटे गतिशील रूप से शीर्ष के यूआरएल प्राप्त करने की अनुमति देता है?
किसी भी संकेत की सराहना की जाएगी !!
चेकआउट http://stackoverflow.com/a/10190836/404145 – DiveInto