2012-11-05 29 views
6

मैं अपने थीसिस प्रोजेक्ट के वर्गीकरण के रूप में यादृच्छिक वन एल्गोरिदम का उपयोग कर रहा हूं। प्रशिक्षण सेट में हजारों छवियां शामिल हैं, और प्रत्येक छवि के लिए 2000 पिक्सल नमूना प्राप्त करते हैं। प्रत्येक पिक्सेल के लिए, मेरे पास हजारों विशेषताएं हैं। मेरी वर्तमान हार्डवेयर सीमाएं (रैम का 8 जी, संभवतः 16 जी तक विस्तार योग्य) मैं को केवल एक छवि के लिए नमूनों (यानी प्रति पिक्सेल सुविधाओं) में फिट करने में सक्षम हूं। मेरा प्रश्न है: क्या एक अलग छवि के नमूने के साथ प्रत्येक बार ट्रेन विधि को कई बार कॉल करना संभव है, और प्रत्येक मॉडल पर स्वचालित रूप से सांख्यिकीय मॉडल अपडेट किया जा सकता है? मैं विशेष रूप से परिवर्तनीय महत्व में रूचि रखता हूं, जब मैं पूरे फीचर सेट के साथ पूर्ण प्रशिक्षण सेट को प्रशिक्षित करता हूं, तो मेरा विचार को हजारों से लेकर 2000 तक सुविधाओं की संख्या को कम करना है, केवल को सबसे महत्वपूर्ण रखना ।ओपनसीवी इटरेटिव यादृच्छिक वन प्रशिक्षण

किसी भी सलाह के लिए धन्यवाद, डेनियल

उत्तर

2

मुझे लगता है कि एल्गोरिथ्म वृद्धिशील प्रशिक्षण का समर्थन करता है न। अन्य फीचर कमी विधि का उपयोग करके, प्रशिक्षण से पहले आप अपने वर्णनकर्ताओं के आकार को कम करने पर विचार कर सकते हैं। या अपनी सभी प्रशिक्षण छवियों में से एक पिक्सेल के यादृच्छिक सबसेट पर वैरिएबल महत्व का आकलन करें, जितना आप अपनी मेमोरी में डाल सकते हैं ...

0

this post पर मेरा उत्तर देखें। यादृच्छिक जंगलों के बढ़ते संस्करण हैं, और वे आपको बहुत बड़े डेटा पर प्रशिक्षित करने देंगे।

+1

दुर्भाग्यवश मैंने आपका उत्तर बहुत देर से पढ़ा है। मैं किसी भी तरह से एक कस्टम कार्यान्वयन के साथ समाप्त होता हूं (किसी श्वास में पहली बार पेड़ की वृद्धि)। इसके अलावा, विकास प्रति-नोड किया जाता है और ओपनसीएल का उपयोग करके समांतर किया जाता है। सभी कोड यहां http://code.google.com/p/parloma/source/browse/#svn%2Ftrunk%2Frandom_forest_gpu है। कोड अब मेरी समस्या (हाथ मुद्रा पहचान) के लिए विशिष्ट है, उम्मीद है कि जेनेरिक समस्याओं को संभालने के लिए पुस्तकालय को फिर से लिखने का समय मिल जाए। – mUogoro

+0

यहां एक और सामान्य उद्देश्य कार्यान्वयन पाया जा सकता है https://github.com/mUogoro/padenti – mUogoro