मैंने अनचाहे भावनात्मक विश्लेषण करने की कोशिश नहीं की है जैसे कि आप वर्णन कर रहे हैं, लेकिन मेरे सिर के ऊपर से मैं कहूंगा कि आप समस्या को अधिक बढ़ा रहे हैं। विशेषण का विश्लेषण करना टेक्स्ट की भावना को समझने के लिए पर्याप्त नहीं है; उदाहरण के लिए, 'बेवकूफ' शब्द पर विचार करें। अकेले, आप इसे नकारात्मक मानेंगे, लेकिन यदि कोई उत्पाद समीक्षा '... [x] उत्पाद अपने प्रतिस्पर्धियों को पहले इस सुविधा के बारे में सोचने के लिए बेवकूफ़ दिखती है ...' तो वहां निश्चित रूप से सकारात्मक होगा । जितना अधिक संदर्भ जिसमें शब्द दिखाई देते हैं, इस तरह कुछ निश्चित रूप से मायने रखता है। यही कारण है कि एक अनियंत्रित बैग-ऑफ-शब्द अकेले दृष्टिकोण (अकेले एक और अधिक सीमित बैग-विशेषण) इस समस्या से निपटने के लिए पर्याप्त नहीं है।
पूर्व वर्गीकृत डेटा ('प्रशिक्षण डेटा') यह निर्धारित करने में मदद करता है कि समस्या यह निर्धारित करने की कोशिश करने से बदलती है कि पाठ सकारात्मक या नकारात्मक भावनाओं को स्क्रैच से है या नहीं, यह निर्धारित करने के लिए कि पाठ सकारात्मक ग्रंथों के समान है या नहीं या नकारात्मक ग्रंथ, और इसे इस तरह वर्गीकृत करें। दूसरा बड़ा मुद्दा यह है कि भावनात्मक विश्लेषण जैसे पाठ विश्लेषण अक्सर डोमेन के आधार पर ग्रंथों की विशेषताओं के अंतर से बहुत प्रभावित होते हैं। यही कारण है कि ट्रेन करने के लिए डेटा का एक अच्छा सेट (यानी, उस डोमेन के भीतर से सटीक डेटा जिसमें आप काम कर रहे हैं, और उम्मीद है कि ग्रंथों के प्रतिनिधि को वर्गीकृत करना होगा) एक अच्छा निर्माण के रूप में महत्वपूर्ण है वर्गीकृत करने के लिए प्रणाली।
बिल्कुल एक लेख नहीं है, लेकिन उम्मीद है कि मदद करता है।
स्रोत
2010-10-13 06:35:03
यह एक उत्तर टैग प्राप्त करता है। यह एक बहुत ही दिलचस्प लेख है। – Trindaz