कौन सा उत्पाद (मैलेट या Weka) पाठ वर्गीकरण कार्य के लिए बेहतर है: सरल प्रशिक्षित करने के लिए बेहतर परिणाम प्रलेखन मैं इस समस्या के लिए नया इसलिए कोई टिप्पणी महान होगी
मैं 100,000 लाइनों (मैलेट प्रारूप में लगभग 34 एमबी) वाली टेक्स्ट फ़ाइल के लिए अवरुद्ध विषयों के लिए मैलेट का उपयोग कर रहा हूं। लेकिन अब मुझे इसे एक फाइल पर चलाने की जरूरत है जिसमें एक मिलियन लाइनें है
मैं मैलेट 2.0.7 के साथ एलडीए विषय मॉडलिंग करने की कोशिश कर रहा हूं। मैं एक एलडीए मॉडल को प्रशिक्षित कर सकता हूं और प्रशिक्षण सत्र से आउटपुट के आधार पर अच्छे नतीजे प्राप्त कर सकता हूं। इसके अलावा, मैं