मुझे असंतुलित डेटा (9 0%, 5%, 5%) के साथ तीन वर्ग की समस्या है। अब मैं LIBSVM का उपयोग कर वर्गीकरण को प्रशिक्षित करना चाहता हूं।असंतुलित डेटा के लिए LIBSVM grid.py का उपयोग करना?
समस्या यह है कि LIBSVM इष्टतम सटीकता के लिए अपने पैरामीटर गामा और लागत को अनुकूलित करता है, जिसका अर्थ है कि 100% उदाहरणों को कक्षा 1 के रूप में वर्गीकृत किया गया है, जो निश्चित रूप से मैं नहीं चाहता हूं।
मैंने वजन घटकों को संशोधित करने की कोशिश की है - बिना किसी सफलता के।
तो मैं जो चाहता हूं, वह ग्रिड.py को संशोधित करने के तरीके को संशोधित करता है जिससे यह परिशुद्धता के लिए लागत और गामा को अनुकूलित करता है और कुल सटीकता के बजाए कक्षाओं द्वारा अलग किया जाता है। क्या उसे करने का कोई तरीका है? या क्या वहां अन्य स्क्रिप्ट हैं जो ऐसा कुछ कर सकती हैं?
धन्यवाद, लेकिन मुझे लगता है कि यह एक और तरीका होना चाहिए: -w0 5 -w1 90 -w2 9 0, क्योंकि छोटी कक्षा में उनके साथ अधिक लागत होनी चाहिए .. इससे मदद मिली! – Damnum
हाँ, मुझे लगता है कि आप सही हैं। मैंने अभी अपना प्रश्न संपादित किया है। धन्यवाद! –
और जब आपके पास 3 से अधिक कक्षाएं हों, तो आप प्रत्येक डब्ल्यू के मूल्य को कैसे विशेषता दे सकते हैं? – lilouch