2012-03-18 11 views
9

हाय मैं ग्रिड खोज और पार सत्यापन का उपयोग करते हुए एसएमओ, जिसमें मेरी गिरी RBF है, का उपयोग करते हुए अब मैं और सिग्मा मूल्यों का चयन करना चाहते SVM ​​वर्गीकरण, प्रदर्शन कर रहा हूँ, मैं कर्नेल नया हूँ फ़ंक्शन, कृपया चरण-दर-चरण प्रक्रिया में सहायता करेंचयन ग और गामा मूल्य

उत्तर

16
  1. सी और सिग्मा के लिए कुछ मान चुनें जो आपको लगता है कि दिलचस्प हैं। उदा।, सी = {1, 10, 100, 1000} और सिग्मा = {.01, .1, 1} (मैं बस इसे बना रहा हूं)।
  2. प्रशिक्षण सेट को के (उदा। 10) भागों में विभाजित करें, अधिमानतः stratified तरीके से।
  3. सी और सिग्मा मूल्यों के सभी जोड़े पर लूप।
    1. अपने प्रशिक्षण सेट के सभी के पर लूप। के 'वें भाग बाहर रखें। संयुक्त सभी अन्य भागों पर एक वर्गीकृत को प्रशिक्षित करें, फिर आयोजित भाग पर परीक्षण करें।
    2. कुछ स्कोर (सटीकता, एफ 1, या जिसे आप अनुकूलित करना चाहते हैं) का ट्रैक रखें।
  4. आपके द्वारा गणना की गई अंकों के द्वारा सी, सिग्मा के लिए सर्वश्रेष्ठ प्रदर्शन मूल्य जोड़ी लौटाएं।
+0

में मौजूद स्पष्ट करने के लिए: "अन्य भागों में से प्रत्येक पर एक वर्गीकारक ट्रेन" आम तौर पर इसका मतलब है कि इसे अन्य भागों पर प्रशिक्षित करें, प्रत्येक व्यक्ति को अलग-अलग नहीं। – Dougal

+0

@Dougal: हाँ, यही मेरा मतलब था। धन्यवाद। –

+0

मुझे लगता है कि आप जो उल्लेख कर रहे हैं (के भागों में विभाजित करना, इत्यादि) को क्रॉस-वैलिडेशन कहा जाता है, विशेष रूप से 10 गुना क्रॉस-सत्यापन। ओपी को यह नहीं पता हो सकता है कि, कभी-कभी अधिक जानकारी प्राप्त करने का प्रयास करने का सबसे कठिन हिस्सा यह जानना है कि कौन से कीवर्ड खोजना चाहते हैं। – karenu

4

चिह-वेई हु, चिह-चुंग चांग और चिह-जेन द्वारा वेक्टर वर्गीकरण का समर्थन करने के लिए एक व्यावहारिक मार्गदर्शिका पढ़ें। वे इस सटीक मुद्दे को संबोधित करते हैं और पैरामीटर चयन के लिए ग्रिड-सर्च करने के तरीकों की व्याख्या करते हैं। http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf

1

मैं larsmans' answer पर थोड़ा सा स्पष्टीकरण जोड़ूंगा।

सी पैरामीटर एक नियमितकरण/ढीला पैरामीटर है। इसके छोटे मूल्य वजन कम होने के लिए मजबूर करते हैं। जितना बड़ा हो जाता है, वज़न की अनुमति सीमा व्यापक हो जाती है। नतीजतन, बड़े सी मूल्य गलत वर्गीकरण के लिए जुर्माना बढ़ाते हैं और इस प्रकार प्रशिक्षण डेटा पर वर्गीकरण त्रुटि दर को कम करते हैं (जो अधिक उपयुक्त हो सकता है)। सी के मूल्य में वृद्धि के रूप में आपका प्रशिक्षण समय और समर्थन वैक्टर की संख्या बढ़ेगी।

आप के.के. द्वारा पढ़ने के लिए भी उपयोगी हो सकते हैं। चिन।

0

आप वर्दी डिजाइन मॉडल चयन का भी उपयोग कर सकते हैं जो आपको जांचने के लिए आवश्यक tuples की संख्या को कम कर देता है। कागज जो बताते हैं यह है अजगर में कुछ कार्यान्वयन कर रहे हैं "वर्दी डिजाइन के माध्यम से समर्थन वेक्टर मशीन के लिए मॉडल चयन" चिएन-मिंग हुआंग द्वारा ssvm 0.2