nltk

    5गर्मी

    1उत्तर

    मैंने अपने डेटा को इकट्ठा करना समाप्त कर दिया है, मैं अपने कॉर्पस के लिए उपयोग करने की योजना बना रहा हूं, लेकिन मैं थोड़ा उलझन में हूं कि मुझे टेक्स्ट को सामान्य बनाना चाहिए या नहीं। मैं & को भविष्य म

    5गर्मी

    2उत्तर

    nltk.corpus.wordnet में समानता फ़ंक्शन दो शब्दों की समानता खोजने के लिए उपयुक्त है? path_similarity()? lch_similarity()? wup_similarity()? res_similarity()? jcn_similarity()?

    19गर्मी

    5उत्तर

    एनएलटीके पुस्तक के माध्यम से जाना, यह स्पष्ट नहीं है कि किसी दिए गए वाक्य से निर्भरता पेड़ कैसे उत्पन्न करें। पुस्तक के प्रासंगिक अनुभाग: sub-chapter on dependency grammar देता है एक example figure ले

    9गर्मी

    2उत्तर

    के माध्यम से सी # में एनएलटीके का उपयोग करके मैं विजुअल स्टूडियो 2010 का उपयोग कर रहा हूं। मेरे पास आयरनपीथन कंसोल प्रोजेक्ट और सी # कंसोल प्रोजेक्ट है। यह IronPython स्क्रिप्ट ठीक काम करता है जब मैं

    5गर्मी

    2उत्तर

    से एक निश्चित संपादन दूरी से अलग वर्डनेट से शब्दों को ढूंढना मैं nltk और wordnet का उपयोग करके एक वर्तनी परीक्षक लिख रहा हूं, मेरे पास कुछ गलत वर्तनी वाले शब्द "बेलीव" कहते हैं। मैं जो करना चाहता हूं

    16गर्मी

    3उत्तर

    मैं एनएलटीके का उपयोग कॉर्पस में एन-ग्राम खोजने के लिए कर रहा हूं लेकिन कुछ मामलों में इसमें काफी समय लग रहा है। मैंने देखा है कि एन-ग्राम की गणना अन्य पैकेजों में एक असामान्य विशेषता नहीं है (जाहिर ह

    11गर्मी

    3उत्तर

    चल रहा है मैं टैग किए गए टोकन से संज्ञा समूह और क्रियान्वयन निकालने के लिए एनएलटीके रेगेक्सपर्सर का उपयोग कर रहा हूं। मैं परिणामस्वरूप पेड़ को एनपी या वी समूहों के केवल हिस्सों को खोजने के लिए कैसे चल

    14गर्मी

    2उत्तर

    मैं एनएलटीके और पायथन के लिए बिल्कुल नया हूं। मैं उदाहरणों में दिए गए खिलौने व्याकरण का उपयोग करके वाक्य पार्स बना रहा हूं लेकिन मुझे यह जानना है कि पेन ट्रीबैंक के एक हिस्से से सीखने वाले व्याकरण का

    6गर्मी

    1उत्तर

    में महत्वपूर्ण शब्दों और वाक्यांशों की पहचान करना मेरे पास एक पायथन स्ट्रिंग में संग्रहीत टेक्स्ट है। क्या मैं कि पाठ में मुख्य शब्द की पहचान करना चाहते। उस पाठ में एन-ग्राम की पहचान करने के लिए (आदर्

    8गर्मी

    2उत्तर

    को बुलड करना मेरे पास XML में 5000 से अधिक विषय अनुक्रमित दस्तावेज़ों का मानव टैग किया गया कॉर्पस है। वे आकार में कुछ सौ किलोबाइट से कुछ सौ मेगाबाइट तक भिन्न होते हैं। पांडुलिपियों के लिए छोटे लेख होन