2012-10-16 7 views
7

भाषण टैगिंग के एनएलटीके भाग के साथ प्रयोग करते समय, मैंने nltk.pos_tag पर अपनी कॉल के आउटपुट में VBP टैग्स का बहुत कुछ देखा। मैंने देखा कि यह टैग ब्राउन कॉर्पस भाषण टैगसेट के हिस्से में नहीं है। हालांकि यह यूपेन टैगसेट का हिस्सा है।भाषण टैगसेट का डिफ़ॉल्ट nltk हिस्सा क्या है?

डिफ़ॉल्ट रूप से nltk किस टैगसेट का उपयोग करता है? मैं इसे आधिकारिक दस्तावेज या एपिडॉक्स में नहीं ढूंढ सकता।

+3

पर टैग की सूची देख सकते हैं जैसे कि यह पेन ट्रीबैंक पर प्रशिक्षित है। https://github.com/nltk/nltk/blob/master/nltk/tag/__init__.py#L80 –

उत्तर

8

एनटीएलएल पेनट्रीबैंक टैगसेट का उपयोग करता है। इस लिंक पर एक नज़र डालें http://nltk.org/api/nltk.tag.html