मैं डेच-मोकोटॉफ ध्वनि और डैमरौ-लेवेनशेटिन दोनों का उपयोग कर रहा हूं यह पता लगाने के लिए कि क्या कोई उपयोगकर्ता प्रविष्टि और एप्लिकेशन में कोई मान "समान" है।एक सापेक्ष लेवेनशेटिन दूरी की गणना - समझ में आता है?
क्या लेवेनशेटिन दूरी को पूर्ण मूल्य के रूप में उपयोग किया जाना चाहिए? अगर मेरे पास 20 अक्षर का शब्द है, तो 4 की दूरी इतनी खराब नहीं है। यदि शब्द में 4 अक्षर हैं ...
अब मैं जो कर रहा हूं वह दूरी प्राप्त करने के लिए दूरी/लंबाई ले रहा है जो बेहतर ढंग से दर्शाता है कि शब्द का प्रतिशत किस प्रकार बदला गया है।
क्या यह एक वैध/सिद्ध दृष्टिकोण है? या यह सादा बेवकूफ है?
यह एक बहुत ही बेवकूफ दृष्टिकोण नहीं है, इसका उपयोग कुछ सफलता से पहले किया गया है। हालांकि बेहतर उपाय हैं। –
आपकी राय में क्या हैं? –