2010-07-05 10 views
21

क्या कोई पैकेज है जिसमें लेवेनशेटिन दूरी गिनती फ़ंक्शन शामिल है जिसे सी या फोरट्रान कोड के रूप में लागू किया गया है? मेरे पास तुलना करने के लिए कई तार हैं और MiscPsycho से stringMatch इसके लिए बहुत धीमी है।आर में फास्ट लेवेनशेटिन दूरी?

उत्तर

16

levenshteinDist (RecordLinkage पैकेज से) संकलित सी कोड कहते हैं। कोशिश करो।

5

आप stringdist पैकेज में Biostrings रूप में अच्छी तरह

12

और stringdist से stringDist की कोशिश कर सकते है कि यह भी, यहां तक ​​कि तेजी से levenshteinDist कतिपय शर्तों के अधीन (1)

+0

stringdist ऊपर काफी है कि ब्लॉग आप लिंक के बाद से तेज़ी आई है : अब यह एकाधिक कोर का उपयोग करता है। –