2013-01-05 19 views
6

के लिए इष्टतम सीखने का नियम ढूंढना किसी दिए गए समस्या के लिए आपको इष्टतम शिक्षण नियम कैसे मिलता है, एकाधिक श्रेणी वर्गीकरण कहें?एएनएन

मैं जेनेटिक एल्गोरिदम का उपयोग करने के बारे में सोच रहा था, लेकिन मुझे पता है कि प्रदर्शन के आसपास के मुद्दे हैं। मैं असली दुनिया के उदाहरणों की तलाश में हूं जहां आपने पाठ्यपुस्तक सीखने के नियमों का उपयोग नहीं किया है, और आपने उन सीखने के नियमों को कैसे पाया है।

उत्तर

9

अच्छा सवाल बीटीडब्ल्यू। (या इस एल्गोरिथ्म के लिए सबसे उपयुक्त है कि किस प्रकार का डेटा)

  1. क्या एल्गोरिथ्म दृढ़ता से पसंद करते हैं करता है:

    वर्गीकरण एल्गोरिदम जैसे कई लक्षण का उपयोग कर वर्गीकृत किया जा सकता।

  2. प्रशिक्षण ओवरहेड। (प्रशिक्षित होने में बहुत समय लगता है)
  3. यह प्रभावी कब है। (बड़ा डेटा - मध्यम डेटा - डेटा की छोटी मात्रा)।
  4. विश्लेषण की जटिलता जो इसे वितरित कर सकती है।

इसलिए, आपकी समस्या के लिए कई श्रेणियों मैं ऑनलाइन रसद प्रतिगमन (SGD से) का उपयोग करेगा वर्गीकृत है क्योंकि यह मध्यम डेटा आकार और (प्रशिक्षण उदाहरण करोड़ों से कम) के लिए छोटे के साथ एकदम सही है यह वास्तव में तेज़ है।

एक और उदाहरण:

मान लीजिए कि आप पाठ डेटा की एक बड़ी राशि को वर्गीकृत करने के लिए है कि करते हैं। तो बेवकूफ बेयस आपका बच्चा है। क्योंकि यह दृढ़ता से पाठ विश्लेषण पसंद करता है। यहां तक ​​कि एसवीएम और एसजीडी तेज हैं, और जैसा कि मैंने ट्रेन करना आसान अनुभव किया है। लेकिन इन नियमों "एसवीएम और एसजीडी" लागू किया जा सकता है जब डेटा आकार मध्यम या छोटे के रूप में माना जाता है और बड़ा नहीं होता है।

सामान्य तौर पर किसी भी डाटा खनन व्यक्ति जब वह किसी भी एमएल या सरल खनन परियोजना शुरू करना चाहता है उसे स्वयं चार afomentioned अंक पूछेंगे।

है कि आप अपने एयूसी, या किसी भी प्रासंगिक को मापने के लिए, को देखने के लिए आप क्या किया है के बाद। क्योंकि आप एक परियोजना में सिर्फ एक वर्गीकरण से अधिक का उपयोग कर सकते हैं। या कभी-कभी जब आपको लगता है कि आपको अपना आदर्श वर्गीकरण मिला है, तो कुछ माप तकनीकों का उपयोग करके परिणाम अच्छे नहीं होते हैं। इसलिए आप यह पता लगाने के लिए फिर से अपने प्रश्नों की जांच शुरू कर देंगे कि आप कहां गलत हो गए थे।

आशा है कि मैंने मदद की है।

5

जब आप नेट पर वेक्टर x इनपुट करते हैं, तो नेट आउटपुट सभी वजन (वेक्टर w) पर निर्भर करेगा। आउटपुट और सही उत्तर के बीच एक त्रुटि होगी। औसत त्रुटि (e) w का एक फ़ंक्शन है, मान लें e = F(w)।मान लीजिए आप एक परत-दो आयाम नेटवर्क है, तो F की छवि कुछ ऐसा दिखाई देगा:

enter image description here

जब हम प्रशिक्षण के बारे में बात करते हैं, हम वास्तव में w जो कम से कम e बनाता है खोजने के बारे में बात कर रहे हैं । दूसरे शब्दों में, हम कम से कम एक फ़ंक्शन खोज रहे हैं। ट्रेन करने के लिए खोजना है।

तो, आप सवाल करते हैं कि खोज करने के तरीके को कैसे चुनें। मेरा सुझाव होगा: यह इस बात पर निर्भर करता है कि F(w) की सतह की तरह दिखती है। यह अधिक है, अधिक यादृच्छिक विधि का उपयोग किया जाना चाहिए, क्योंकि ढाल अवरोही के आधार पर सरल विधि आपको स्थानीय न्यूनतम द्वारा फंसाने के लिए मार्गदर्शन करने का बड़ा मौका होगा - इसलिए आप वैश्विक न्यूनतम खोजने का मौका खो देते हैं। दूसरी तरफ, यदि F(w) का सूफ एक बड़े गड्ढे की तरह दिखता है, तो आनुवांशिक एल्गोरिदम भूल जाएं। ढाल उतरने के आधार पर एक साधारण बैक प्रचार या कुछ भी इस मामले में बहुत अच्छा होगा।

आप पूछ सकते हैं कि मैं कैसे जान सकता हूं कि सतह की तरह कैसे दिखती है? यह अनुभव का एक कौशल है। या आप सतह के अंतर्ज्ञानी दृश्य प्राप्त करने के लिए कुछ w यादृच्छिक रूप से नमूना करना चाहते हैं, और F(w) की गणना कर सकते हैं।