हाय मैं ग्रिड खोज और पार सत्यापन का उपयोग करते हुए एसएमओ, जिसमें मेरी गिरी RBF है, का उपयोग करते हुए अब मैं ग और सिग्मा मूल्यों का चयन करना चाहते SVM वर्गीकरण, प्रदर्शन कर रहा हूँ, मैं कर्नेल नया हूँ फ़ंक्शन, कृपया चरण-दर-चरण प्रक्रिया में सहायता करेंचयन ग और गामा मूल्य
उत्तर
- सी और सिग्मा के लिए कुछ मान चुनें जो आपको लगता है कि दिलचस्प हैं। उदा।, सी = {1, 10, 100, 1000} और सिग्मा = {.01, .1, 1} (मैं बस इसे बना रहा हूं)।
- प्रशिक्षण सेट को के (उदा। 10) भागों में विभाजित करें, अधिमानतः stratified तरीके से।
- सी और सिग्मा मूल्यों के सभी जोड़े पर लूप।
- अपने प्रशिक्षण सेट के सभी के पर लूप। के 'वें भाग बाहर रखें। संयुक्त सभी अन्य भागों पर एक वर्गीकृत को प्रशिक्षित करें, फिर आयोजित भाग पर परीक्षण करें।
- कुछ स्कोर (सटीकता, एफ 1, या जिसे आप अनुकूलित करना चाहते हैं) का ट्रैक रखें।
- आपके द्वारा गणना की गई अंकों के द्वारा सी, सिग्मा के लिए सर्वश्रेष्ठ प्रदर्शन मूल्य जोड़ी लौटाएं।
चिह-वेई हु, चिह-चुंग चांग और चिह-जेन द्वारा वेक्टर वर्गीकरण का समर्थन करने के लिए एक व्यावहारिक मार्गदर्शिका पढ़ें। वे इस सटीक मुद्दे को संबोधित करते हैं और पैरामीटर चयन के लिए ग्रिड-सर्च करने के तरीकों की व्याख्या करते हैं। http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
मैं larsmans' answer पर थोड़ा सा स्पष्टीकरण जोड़ूंगा।
सी पैरामीटर एक नियमितकरण/ढीला पैरामीटर है। इसके छोटे मूल्य वजन कम होने के लिए मजबूर करते हैं। जितना बड़ा हो जाता है, वज़न की अनुमति सीमा व्यापक हो जाती है। नतीजतन, बड़े सी मूल्य गलत वर्गीकरण के लिए जुर्माना बढ़ाते हैं और इस प्रकार प्रशिक्षण डेटा पर वर्गीकरण त्रुटि दर को कम करते हैं (जो अधिक उपयुक्त हो सकता है)। सी के मूल्य में वृद्धि के रूप में आपका प्रशिक्षण समय और समर्थन वैक्टर की संख्या बढ़ेगी।
आप के.के. द्वारा पढ़ने के लिए भी उपयोगी हो सकते हैं। चिन।
आप वर्दी डिजाइन मॉडल चयन का भी उपयोग कर सकते हैं जो आपको जांचने के लिए आवश्यक tuples की संख्या को कम कर देता है। कागज जो बताते हैं यह है अजगर में कुछ कार्यान्वयन कर रहे हैं "वर्दी डिजाइन के माध्यम से समर्थन वेक्टर मशीन के लिए मॉडल चयन" चिएन-मिंग हुआंग द्वारा ssvm 0.2
में मौजूद स्पष्ट करने के लिए: "अन्य भागों में से प्रत्येक पर एक वर्गीकारक ट्रेन" आम तौर पर इसका मतलब है कि इसे अन्य भागों पर प्रशिक्षित करें, प्रत्येक व्यक्ति को अलग-अलग नहीं। – Dougal
@Dougal: हाँ, यही मेरा मतलब था। धन्यवाद। –
मुझे लगता है कि आप जो उल्लेख कर रहे हैं (के भागों में विभाजित करना, इत्यादि) को क्रॉस-वैलिडेशन कहा जाता है, विशेष रूप से 10 गुना क्रॉस-सत्यापन। ओपी को यह नहीं पता हो सकता है कि, कभी-कभी अधिक जानकारी प्राप्त करने का प्रयास करने का सबसे कठिन हिस्सा यह जानना है कि कौन से कीवर्ड खोजना चाहते हैं। – karenu