के साथ एनएलटीके नामांकित इकाई पहचान एनएलटीके का उपयोग करके मैं अपने पाठ से नामित इकाइयों को निकालने की कोशिश कर रहा हूं। मुझे लगता है कि एनएलटीके एनईआर मेरे उद्देश्य के लिए बहुत सटीक नहीं है और मैं अपने स्वयं के कुछ और टैग भी जोड़ना चाहता हूं। मैं अपने स्वयं के एनईआर को प्रशिक्षित करने का एक तरीका खोजने की कोशिश कर रहा हूं, लेकिन मुझे सही संसाधन खोजने में सक्षम नहीं लगता है। मैं के बारे में NLTK-कस्टम डेटा
- मैं अपने खुद के डेटा का उपयोग कर सकते NLTK में एक वर्णित निकाय पहचानकर्ता प्रशिक्षित करने के लिए सवालों की एक जोड़ी है?
- यदि मैं अपने डेटा का उपयोग करके ट्रेन कर सकता हूं, तो नाम_entity.py फ़ाइल को संशोधित किया जाना चाहिए?
- क्या इनपुट फ़ाइल प्रारूप आईओबी उदाहरण में होना चाहिए। एरिक एनएनपी बी-व्यक्ति?
- क्या कोई संसाधन हैं - एनएलटीके कुकबुक और एनएलपी के अलावा जो कि मैं उपयोग कर सकता हूं?
मैं वास्तव में इस संबंध
एसएनईआर साइट के माध्यम से ब्राउज़िंग, मैंने देखा कि यहां एक अजगर इंटरफ़ेस भी है [यहां] (https://github.com/dat/pyner)। यह सुनिश्चित नहीं है कि यह कितना परिपक्व है, लेकिन यह सहायक हो सकता है। – senderle
यह प्रश्न एनएलटीके नाम की इकाई पहचान में सुधार के लिए एक खोज में बहुत कुछ आता है, लेकिन कह रहा है कि 'कुछ और उपयोग करें' यह जानकारीपूर्ण नहीं है। – blueblank
मुझे एक ही समस्या थी और साझा किया कि मेरे लिए क्या काम किया। क्षमा करें अगर वह आपको परेशान करता है :( – jjdubs