This शुरू करने के लिए एक अच्छी जगह हो सकती है। यह एक बेवकूफ Bayesian वर्गीकरण के एक पायथन कार्यान्वयन के लिए पूर्ण स्रोत कोड (पाठ पार्सर, डेटा भंडारण, और वर्गीकृत) है। हालांकि यह पूरा हो गया है, यह अभी भी एक सत्र में पचाने के लिए काफी छोटा है। मुझे लगता है कि कोड उचित रूप से अच्छी तरह से लिखा है और अच्छी तरह से टिप्पणी की है। यह प्रोग्रामिंग कलेक्टिव इंटेलिजेंस पुस्तक के लिए स्रोत कोड फ़ाइलों का हिस्सा है।
स्रोत प्राप्त करने के लिए, मुख्य फ़ोल्डर 'पीसीआई_Cओडी' से लिंक, डीएल और ज़िप को अनपैक करें, फ़ोल्डर 'अध्याय 6' पर जाएं, जिसमें एक पायथन स्रोत फ़ाइल 'docclass.py है। बेयसियन स्पैम फ़िल्टर के लिए यह पूर्ण स्रोत कोड है। प्रशिक्षण डेटा (ईमेल) एक एसक्लाइट डेटाबेस में बनाए रखा जाता है जिसे एक ही फ़ोल्डर ('test.db') में भी शामिल किया जाता है, आपको केवल एकमात्र बाहरी लाइब्रेरी की आवश्यकता होती है जो कि स्क्लाइट (pysqlite) के लिए पाइथन बाइंडिंग होती है; यदि आपको पहले से इंस्टॉल नहीं किया गया है तो आपको खुद को स्क्लाइट की भी आवश्यकता है)।
क्या ऐसा कुछ है जिसे आप जानते हैं जिसमें निरंतर चर की अनुमति मिलती है? – disappearedng
[pebl ट्यूटोरियल] (http://ano.malo.us/pebl/docs/tutorial.html) विघटनकारी को कवर करता है, इसलिए मुझे लगता है कि यह कम से कम उस विधि के माध्यम से निरंतर चर को संभाल सकता है। –