2010-04-05 5 views
20

मैंने बेवकूफ बेयसियन वर्गीकरण के लिए ऑरेंज फ्रेमवर्क की कोशिश की है। विधियां बेहद अनजान हैं, और दस्तावेज़ीकरण बेहद असंगठित है। क्या यहां किसी को भी सिफारिश करने के लिए एक और ढांचा है?पायथन में कोई बेवकूफ बेयसियन क्लासिफायरफायर?

मैं अब ज्यादातर नाइवेबेसियन का उपयोग करता हूं। मैं nltk के NaiveClassification का उपयोग करने के बारे में सोच रहा था लेकिन तब उन्हें नहीं लगता कि वे लगातार चर को संभाल सकते हैं।

मेरे विकल्प क्या हैं?

उत्तर

9

यदि आप प्राकृतिक भाषा प्रसंस्करण कर रहे हैं, तो Natural Language Toolkit देखें।

यदि आप कुछ और ढूंढ रहे हैं, तो यहां एक साधारण search on PyPI है।

pebl निरंतर चर को संभालने के लिए प्रतीत होता है।

+0

क्या ऐसा कुछ है जिसे आप जानते हैं जिसमें निरंतर चर की अनुमति मिलती है? – disappearedng

+0

[pebl ट्यूटोरियल] (http://ano.malo.us/pebl/docs/tutorial.html) विघटनकारी को कवर करता है, इसलिए मुझे लगता है कि यह कम से कम उस विधि के माध्यम से निरंतर चर को संभाल सकता है। –

13

This शुरू करने के लिए एक अच्छी जगह हो सकती है। यह एक बेवकूफ Bayesian वर्गीकरण के एक पायथन कार्यान्वयन के लिए पूर्ण स्रोत कोड (पाठ पार्सर, डेटा भंडारण, और वर्गीकृत) है। हालांकि यह पूरा हो गया है, यह अभी भी एक सत्र में पचाने के लिए काफी छोटा है। मुझे लगता है कि कोड उचित रूप से अच्छी तरह से लिखा है और अच्छी तरह से टिप्पणी की है। यह प्रोग्रामिंग कलेक्टिव इंटेलिजेंस पुस्तक के लिए स्रोत कोड फ़ाइलों का हिस्सा है।

स्रोत प्राप्त करने के लिए, मुख्य फ़ोल्डर 'पीसीआई_Cओडी' से लिंक, डीएल और ज़िप को अनपैक करें, फ़ोल्डर 'अध्याय 6' पर जाएं, जिसमें एक पायथन स्रोत फ़ाइल 'docclass.py है। बेयसियन स्पैम फ़िल्टर के लिए यह पूर्ण स्रोत कोड है। प्रशिक्षण डेटा (ईमेल) एक एसक्लाइट डेटाबेस में बनाए रखा जाता है जिसे एक ही फ़ोल्डर ('test.db') में भी शामिल किया जाता है, आपको केवल एकमात्र बाहरी लाइब्रेरी की आवश्यकता होती है जो कि स्क्लाइट (pysqlite) के लिए पाइथन बाइंडिंग होती है; यदि आपको पहले से इंस्टॉल नहीं किया गया है तो आपको खुद को स्क्लाइट की भी आवश्यकता है)।

+1

क्या मैं टोबी की किताब के लिए एक प्लग भी जोड़ सकता हूं, जो उत्कृष्ट है। यदि आप अपने स्रोत कोड का उपयोग कर रहे हैं, तो उसे समर्थन देना अच्छा हो सकता है! सबसे महत्वपूर्ण बात यह है कि यह फ़ाइल दिखाती है कि एक बेवकूफ बेयस प्रणाली, यदि आप सभी एसक्यूएल हैंडलिंग को हटाते हैं, तो केवल कुछ पंक्तियां लंबी होती हैं। यदि आप एक छोटे से की तलाश में हैं, तो आप बस अपना खुद का बना सकते हैं। महत्वपूर्ण कार्य केवल 'fprob' और' weightedprob' और 'naivebayes.classify' – Ian

+0

हैं I प्रोग्रामिंग कलेक्टिव इंटेलिजेंस में स्रोत कोड को भयानक पाया गया है (संभवतः क्योंकि यह पुराने, और यूग्लियर, पायथन के संस्करण में लिखा गया था)। बदसूरत कोड के बावजूद, मैं मशीन सीखने के परिचय के लिए पुस्तक की अत्यधिक अनुशंसा करता हूं। – Buttons840

+1

डाउनलोड करने का लिंक टूटा हुआ है। क्या कोई नया लिंक जानता है? – krasnaya

24

scikit-learn गाऊसी अनुभवहीन बायेसियन वर्गीकारक के implementation है बदल दिया। आम तौर पर, इस पुस्तकालय का लक्ष्य कोड के बीच एक अच्छा व्यापार प्रदान करना है जो पढ़ने और उपयोग करने में आसान और दक्षता है। उम्मीद है कि यह एल्गोरिदम काम सीखने के लिए एक अच्छी पुस्तकालय होना चाहिए।

0

SpamBayes भी है, जो मुझे लगता है कि स्पैम के बजाय, सामान्य बेवकूफ Bayesian Clasisfier के रूप में उपयोग किया जा सकता है।

3

मुझे Divmod Reverend पाइथन बेयसियन वर्गीकृत का उपयोग करने के लिए सबसे सरल और आसान होने के लिए मिला।

+0

लिंक टूट गया। https: // GitHub।com/MostAwesomeDude/divmod-docs मान्य – Quamis

+0

लिंक अभी भी मेरे लिए काम करता है ... – Cerin

+0

हाँ, कल मैंने काम नहीं किया जब मैंने कोशिश की कि – Quamis