n-gram

    15गर्मी

    3उत्तर

    में एन-ग्राम आवृत्ति की गणना करना मेरे पास निम्न कोड है। मुझे पता है कि मैं आवृत्ति गणना से कम कोलेक्शन को फ़िल्टर करने के लिए apply_freq_filter फ़ंक्शन का उपयोग कर सकता हूं। हालांकि, मुझे नहीं पता कि

    6गर्मी

    2उत्तर

    जब मैं edgengram के साथ एक विश्लेषक का उपयोग (न्यूनतम = 3, अधिकतम = 7, सामने) + term_vector = with_positions_offsets पाठ दस्तावेज़ होने = "CouchDB" के साथ जब मैं "couc" के लिए खोज मेरे आकर्षण पर "cou"

    16गर्मी

    3उत्तर

    मैं एनएलटीके का उपयोग कॉर्पस में एन-ग्राम खोजने के लिए कर रहा हूं लेकिन कुछ मामलों में इसमें काफी समय लग रहा है। मैंने देखा है कि एन-ग्राम की गणना अन्य पैकेजों में एक असामान्य विशेषता नहीं है (जाहिर ह

    6गर्मी

    2उत्तर

    मैं खोज शब्द की एक सूची 'भरने' के लिए एक एल्गोरिदम लिखने की कोशिश कर रहा हूं (जो मुझे लगता है कि प्राकृतिक भाषा प्रसंस्करण तकनीकों पर भरोसा करेगा)। शायद इस तरह की चीज का नाम है जिसे मैं अनजान हूं। इस

    6गर्मी

    2उत्तर

    के साथ एन-ग्राम मॉडलिंग मुझे एन-ग्राम्स (एन शब्दों के अनुक्रम) और उनके संदर्भों (जो शब्द एन-ग्राम के पास उनके आवृत्ति के साथ दिखाई देते हैं) के संग्रह को मॉडल करने की आवश्यकता है। का मेरा विचार यह था:

    5गर्मी

    1उत्तर

    के साथ एन-ग्राम पाइथन के लिए नया और मदद चाहिए! मैं अजगर एनएलटीके पाठ वर्गीकरण के साथ अभ्यास कर रहा था। यहाँ कोड उदाहरण मैं पर http://www.laurentluce.com/posts/twitter-sentiment-analysis-using-python-a

    9गर्मी

    2उत्तर

    टेक्स्ट के ब्लॉक से कीफ्रेज़ निकालने का सबसे अच्छा तरीका क्या है? मैं कीवर्ड निष्कर्षण करने के लिए एक उपकरण लिख रहा हूं: something like this। मुझे पाइथन और पर्ल के लिए एन-ग्राम निकालने के लिए कुछ पुस्

    7गर्मी

    3उत्तर

    मैं स्कैला में एन-ग्राम के आधार पर पृथक प्रेस एल्गोरिदम कोड करने की कोशिश कर रहा हूं। बड़ी फ़ाइलों के लिए एन-ग्राम कैसे उत्पन्न करें: उदाहरण के लिए, "मधुमक्खी मधुमक्खियों का मधुमक्खी" वाली फ़ाइल के लि

    8गर्मी

    5उत्तर

    मैं बस सोच रहा हूं कि कंप्यूटिंग ओवरहेड पर कंप्यूटिंग करने पर विचार करने वाले एन-ग्राम्स (एन> 3) (और उनकी घटना आवृत्ति) का उपयोग क्या है। क्या कोई ऐसे अनुप्रयोग हैं जहां बिग्राम या ट्रिग्राम बस पर्याप

    5गर्मी

    1उत्तर

    मैं वाक्य समानता के बारे में एक परियोजना पर काम कर रहा हूं। मुझे पता है कि एसओ में कई बार पूछा गया है, लेकिन मैं सिर्फ यह जानना चाहता हूं कि जिस तरीके से मैं इसे कर रहा हूं, उस तरीके से मेरी समस्या को