2012-06-11 14 views
5

मैंने बेवकूफ बेयस क्लासिफायरफायर की कोशिश की और यह बहुत खराब काम कर रहा है। एसवीएम थोड़ा बेहतर काम करता है लेकिन अभी भी भयानक है। अधिकांश कागजात जो मैंने कुछ भिन्नताओं (एन-ग्राम, पीओएस इत्यादि) के साथ एसवीएम और बेवकूफ बेय के बारे में पढ़े हैं, लेकिन उनमें से सभी 50% के करीब परिणाम देते हैं (लेखकों के लेखक 80% और उच्चतर बात करते हैं लेकिन मुझे सटीक नहीं मिल सकता वास्तविक डेटा पर)।भाव विश्लेषण के लिए अच्छा एल्गोरिदम

क्या लेक्सिक्सल एनालिस को छोड़कर कोई और शक्तिशाली तरीका है? एसवीएम और बेयस मानते हैं कि शब्द स्वतंत्र हैं। इन दृष्टिकोणों को "शब्दों का थैला" कहा जाता है। क्या होगा यदि हम मानते हैं कि शब्द जुड़े हुए हैं?

उदाहरण के लिए: अगर यह "बुरा और भयानक" है, तो 70% संभावना है कि सजा नकारात्मक है, तो यह जानने के लिए apriory एल्गोरिदम का उपयोग करें। इसके अलावा हम शब्दों के बीच दूरी का उपयोग भी कर सकते हैं।

क्या यह अच्छा विचार है या मैं साइकिल का आविष्कार कर रहा हूं?

उत्तर

2

आप यहां कुछ अवधारणाओं को भ्रमित कर रहे हैं। न तो बेवकूफ बेयस और न ही एसवीएम शब्द दृष्टिकोण के बैग से बंधे हैं। न तो एसवीएम और न ही बॉव दृष्टिकोण के बीच शर्तों के बीच स्वतंत्रता धारणा है।

ये कुछ चीजें हैं आप की कोशिश कर सकते हैं:

  • शब्दों के अपने बैग में विराम चिह्न शामिल हैं; esp। ! तथा ? , भावना विश्लेषण के लिए सहायक हो सकता है, जबकि कई सुविधा दस्तावेज़ वर्गीकरण की ओर तैयार एक्सट्रैक्टर्स रोकने वाले शब्द के लिए दूर उन्हें फेंक
  • ही: जैसे शब्द "मैं" और "मेरा" व्यक्तिपरक पाठ का संकेत हो सकता
  • एक दो चरण वर्गीकारक निर्माण ; पहले यह निर्धारित करें कि क्या कोई राय व्यक्त की गई है, फिर चाहे वह सकारात्मक या नकारात्मक
  • सुविधाओं के बीच बातचीत को कैप्चर करने के लिए एक रैखिक के बजाय एक वर्गबद्ध कर्नेल SVM आज़माएं।
+0

आप शब्दों के बीच apriory एल्गोरिदम और assotiation के बारे में क्या सोचते हैं? – Neir0

+0

@ नीर 0: मैं तुरंत नहीं देखता कि आप इसे कैसे लागू करना चाहते हैं। मैंने कभी भी भावनात्मक विश्लेषण करने के प्रयासों को कभी नहीं देखा है। मुझे पता है कि कुछ लोग इसे वर्गिक कर्नेल के अनुमानों के निर्माण के लिए उपयोग करते हैं (मोटे तौर पर जिसे आप "शब्द संघ" कहते हैं), लेकिन फिर मैं पहले एक वेनिला कर्नेल एसवीएम आज़माउंगा। –

+0

बैज नकारात्मक या pos के साथ टोकन इनपुट करने के लिए सीधा तरीका है। उदाहरण के लिए: "pos मैं अपनी माँ से प्यार करता हूँ"। आउटपुट पर मुझे कुछ मिलता है "अगर हमारे पास प्यार और माँ को भेड़िये में 70% है तो हमारे पास पॉज़ बैज है"। बेशक हम बेहतर परिणामों के लिए इस दृष्टिकोण को संशोधित कर सकते हैं। – Neir0

4

एल्गोरिदम SVM, अनुभवहीन Bayes और अधिकतम एन्ट्रापी लोगों की तरह मशीन सीखने एल्गोरिदम की देखरेख कर रहे हैं और अपने कार्यक्रम के उत्पादन में प्रशिक्षण सेट आपके द्वारा दी गई पर निर्भर करता है। बड़े पैमाने पर भावनात्मक विश्लेषण के लिए मैं असुरक्षित सीखने की विधि का उपयोग करना पसंद करता हूं जिसमें कोई भी उन्मुख भागों में क्लस्टरिंग दस्तावेजों द्वारा विशेषण की भावनाओं को निर्धारित कर सकता है, और क्लस्टर को सकारात्मक या नकारात्मक लेबल कर सकता है। इस पत्र से अधिक जानकारी मिल सकती है। http://icwsm.org/papers/3--Godbole-Srinivasaiah-Skiena.pdf

आशा यह आपके काम :)

0

में मदद करता है आप Sentimnetal analysis using python पर कुछ उपयोगी सामग्री भी उपलब्ध हैं। 3 सरल रूप में

  • लेबलिंग डेटा
  • Preprocessing &
  • मॉडल सीखना
0

भावना विश्लेषण चल रहे शोध का एक क्षेत्र है कदम इस प्रस्तुति भावना विश्लेषण का सारांश है। और अभी बहुत सारे शोध चल रहे हैं। सबसे हालिया, सबसे सफल दृष्टिकोणों के एक सिंहावलोकन के लिए, मैं आम तौर पर आपको सेमेवल के साझा कार्यों को देखने के लिए सलाह दूंगा। आम तौर पर, हर साल वे ट्विटर में सेंटीमेंट विश्लेषण पर एक प्रतियोगिता चलाते हैं।आप कार्य का वर्णन करने वाले पेपर को ढूंढ सकते हैं, और यहां 2016 के परिणाम (हालांकि थोड़ा तकनीकी हो सकता है): http://alt.qcri.org/semeval2016/task4/data/uploads/semeval2016_task4_report.pdf

वहां से शुरू करने से, आप व्यक्तिगत सिस्टम का वर्णन करने वाले कागजात देख सकते हैं (जैसा कि संदर्भित किया गया है) ।