मैंने विकिपीडिया लेख शीर्षक फ़ाइल डाउनलोड की जिसमें प्रत्येक विकिपीडिया आलेख का नाम शामिल है। मुझे उन सभी लेख शीर्षकों की खोज करने की आवश्यकता है जो संभव मिलान हो सकते हैं। उदाहरण के लिए, मेरे पास "हॉकी" शब्द हो सकता है, लेकिन हॉकी के लिए विकिपीडिया लेख जो मैं चाहता हूं वह "Ice_hockey" है। यह एक मामूली असंवेदनशील खोज भी होनी चाहिए।स्ट्रिंग्स (पायथन) की बड़ी फ़ाइल में आंशिक स्ट्रिंग मैचों को खोजने का सबसे प्रभावी तरीका
मैं पाइथन का उपयोग कर रहा हूं, और क्या लाइन खोज द्वारा लाइन करने के बजाय एक और अधिक प्रभावी तरीका है? मैं इस खोज को 500 या 1000 बार प्रति मिनट आदर्श रूप से करूँगा। यदि रेखा से रेखा मेरा एकमात्र विकल्प है, तो क्या मैं इसमें कुछ अनुकूलन कर सकता हूं?
मुझे लगता है कि फ़ाइल में कई मिलियन लाइनें हैं।
कोई विचार?
धन्यवाद।
कृपया अपेक्षित इनपुट दिखाएं। फ़ाइल में किस प्रारूप में है? उन लोगों को न बनाएं जो आपको स्वयं के लिए फ़ाइल डाउनलोड करने में मदद करना चाहते हैं। – aaronasterling
यह प्रत्येक शीर्षक के साथ अपनी लाइन पर बस एक साधारण पाठ फ़ाइल है – apexdodge