भाषण टैगिंग के एनएलटीके भाग के साथ प्रयोग करते समय, मैंने nltk.pos_tag
पर अपनी कॉल के आउटपुट में VBP
टैग्स का बहुत कुछ देखा। मैंने देखा कि यह टैग ब्राउन कॉर्पस भाषण टैगसेट के हिस्से में नहीं है। हालांकि यह यूपेन टैगसेट का हिस्सा है।भाषण टैगसेट का डिफ़ॉल्ट nltk हिस्सा क्या है?
डिफ़ॉल्ट रूप से nltk किस टैगसेट का उपयोग करता है? मैं इसे आधिकारिक दस्तावेज या एपिडॉक्स में नहीं ढूंढ सकता।
पर टैग की सूची देख सकते हैं जैसे कि यह पेन ट्रीबैंक पर प्रशिक्षित है। https://github.com/nltk/nltk/blob/master/nltk/tag/__init__.py#L80 –