मैं सोच रहा था कि स्पैम और टेक्स्ट वर्गीकरण के लिए बेयसियन फ़िल्टरिंग का कोई अच्छा और साफ ऑब्जेक्ट उन्मुख प्रोग्रामिंग (ओओपी) कार्यान्वयन है या नहीं? यह सिर्फ सीखने के उद्देश्यों के लिए है।ऑब्जेक्ट ओरिएंटेड बेयसियन स्पैम फ़िल्टरिंग?
उत्तर
का चेक बाहर अध्याय 6 मैं निश्चित रूप से Weka की सलाह देते हैं जो एक मुक्त स्रोत डाटा माइनिंग सॉफ्टवेयर लिखा है खोजने के लिए सक्षम होना चाहिए जावा में:
वीका डेटा खनन कार्यों के लिए मशीन लर्निंग एल्गोरिदम का संग्रह है। एल्गोरिदम या तो सीधे डेटासेट पर लागू किया जा सकता है या अपने स्वयं के जावा कोड से बुलाया जा सकता है। वेका में डेटा प्री-प्रोसेसिंग, वर्गीकरण, रिग्रेशन, क्लस्टरिंग, एसोसिएशन नियम, और विज़ुअलाइज़ेशन के लिए टूल शामिल हैं। यह नई मशीन लर्निंग स्कीम विकसित करने के लिए भी उपयुक्त है।
ऊपर उल्लेख किया है, यह, अनुभवहीन Bayes (बेशक) SVM, Winnow, C4.5 की तरह अलग अलग classifiers के एक गुच्छा और कई और अधिक (API doc देखें) के साथ जहाजों। ध्यान दें कि बहुत से वर्गीकरण स्पैम पहचान या टेक्स्ट वर्गीकरण के क्षेत्र में Naive Bayes की तुलना में बहुत बेहतर perfomance के लिए जाने जाते हैं।
इसके अलावा Weka आप लाता है एक बहुत ही powerful GUI ...
शायद https://ci-bayes.dev.java.net/ या http://www.cs.cmu.edu/~javabayes/Home/node2.html?
मैंने कभी इसके साथ कभी नहीं खेला।
यहां सी #: A Naive Bayesian Spam Filter for C# (कोडप्रोजेक्ट पर होस्ट किया गया) में बेयसियन फ़िल्टरिंग का कार्यान्वयन है।
फ्रेंच में, लेकिन आप डाउनलोड लिंक :) PHP Naive Bayesian Filter
nBayes - एक और सी # कार्यान्वयन CodePlex
पर होस्ट