6

सबसे अच्छा तरीका है Weka के C4.5 (J48) निर्णय के पेड़ के साथ मान अनुपलब्ध सुविधा को संभालने के लिए विशेषता क्या है? लापता मूल्यों की समस्या प्रशिक्षण और वर्गीकरण दोनों के दौरान होती है।सी 4.5 (जे 48) निर्णय पेड़ में गायब विशेषता मानों से कैसे निपटें?

  1. यदि प्रशिक्षण उदाहरणों से मूल्य गुम हैं, तो क्या मैं यह मानने में सही हूं कि मैं '?' सुविधा के लिए मूल्य?

  2. मान लीजिए कि मैं सफलतापूर्वक निर्णय वृक्ष का निर्माण और उसके बाद Weka के वृक्ष संरचना से सी ++ या जावा में अपने खुद के पेड़ कोड बनाने के लिए कर रहा हूँ। वर्गीकरण समय के दौरान, यदि मैं एक नया उदाहरण वर्गीकृत करने की कोशिश कर रहा हूं, तो उन मूल्यों के लिए मैं क्या मूल्य डालूं जिनमें मूल्य गुम हैं? मैं एक निर्णय नोड के पीछे पेड़ कैसे उतरूंगा जिसके लिए मेरे पास अज्ञात मूल्य है?

बेकार मूल्यों को संभालने के लिए बेवकूफ बेयस का उपयोग करना बेहतर होगा? मैं सिर्फ उनके लिए एक बहुत ही छोटी गैर-शून्य संभावना असाइन करूंगा, है ना?

उत्तर

8

वाशिंगटन विश्वविद्यालय में पेड्रो डोमिंगोस 'एमएल पाठ्यक्रम से:

यहाँ तीन दृष्टिकोण हैं क्या पेड्रो A का मूल्य लापता के लिए पता चलता है:

  • असाइन नोड के लिए हल कर अन्य उदाहरण के बीच A का सबसे आम मूल्य n
  • असाइन एक ही लक्ष्य मूल्य के साथ अन्य उदाहरण के बीच A का सबसे आम मूल्य
  • असाइन संभावनाप्रत्येक संभव मूल्य A की v_i करने के लिए; उदाहरण के लिए पेड़ में प्रत्येक वंशज को अंश p_i असाइन करें।

स्लाइड्स और वीडियो अब here पर देखे जा सकते हैं।

+0

महान जानकारी। धन्यवाद। मैं वीडियो देखूँगा। – stackoverflowuser2010

+0

द्वारा "एन नोड के लिए क्रमबद्ध", तो आप सिर्फ एटी नोड n अन्य नमूनों के बीच, सही मतलब है? –

+0

मुझे यकीन नहीं है कि मैं अंतिम बिंदु को समझता हूं। वर्तमान प्रशिक्षण उदाहरण में मान "एक्स" या "Y", हो सकता है लेकिन विशेषता है, है ना दो pribabilities साथ दो मानों पकड़ नहीं कर सकते? तो इसका क्या मतलब है? – n1try

2

गुम मूल्य को '?' के रूप में छोड़ने का एक वैकल्पिक तरीका है, और सूचना लाभ गणना के लिए इसका उपयोग नहीं करना है। वर्गीकरण के दौरान किसी नोड के पास अज्ञात मान होना चाहिए क्योंकि आपने सूचना लाभ चरण के दौरान इसे अनदेखा किया था। वर्गीकरण के लिए, मेरा मानना ​​है कि आप बस अज्ञात मूल्य को अज्ञात मानते हैं और उस विशिष्ट विशेषता पर वर्गीकरण के दौरान इसे हटा नहीं देते हैं।

 संबंधित मुद्दे

  • कोई संबंधित समस्या नहीं^_^