2012-08-29 12 views
6

उत्पादन, तथापि, मैं झरना कि जब मैं कोडscikit सीखने जीएमएम मैं गाऊसी मिश्रण मॉडल का उपयोग कर रहा अजगर scikit सीखने पैकेज से मेरी डाटासेट प्रशिक्षित करने के लिए सकारात्मक लॉग संभावना

- जी = mixture.GMM (.. ।)

- G.fit (...)

- G.score (योग सुविधा)

जिसके परिणामस्वरूप लॉग संभावना सकारात्मक वास्तविक संख्या है ... यही कारण है कि है? लॉग की संभावना नहीं है नकारात्मक होने की गारंटी है?

मुझे यह मिल गया। गॉसियन मिक्स्चर मॉडल हमारे पास क्या लौटाता है मैं संभावना "द्रव्यमान" की बजाय लॉग संभावना "घनत्व" तो सकारात्मक मूल्य पूरी तरह से उचित है।

तो सहप्रसरण मैट्रिक्स विलक्षण के पास है, तो जीएमएम अच्छी तरह से perfomr नहीं होगा, और आम तौर पर इसका मतलब है कि डेटा इस तरह के उत्पादक कार्य के लिए अच्छा नहीं है

+2

यह एक बग की तरह लगता है, क्या आप कृपया एक न्यूनतम प्रजनन स्क्रिप्ट दे सकते हैं? बीटीडब्ल्यू: आप सीधे https://github.com/scikit-learn/scikit-learn/issues – ogrisel

उत्तर

9

सकारात्मक लॉग संभावनाओं ठीक हैं।

याद रखें कि जीएमएम गणना की संभावना संभाव्यता घनत्व समारोह (पीडीएफ) है, इसलिए किसी भी व्यक्तिगत बिंदु पर एक से अधिक हो सकता है।

प्रतिबंध यह है कि पीडीएफ को डेटा डोमेन पर एक को एकीकृत करना होगा।

यदि लॉग संभावना बहुत बड़ी हो जाती है, तो अनुमान एल्गोरिदम एक अपर्याप्त समाधान तक पहुंच सकता है (यदि आपके पास एक छोटा डेटासेट है तो अधिकतम संभावना अनुमान के साथ आम)।

यह जांचने के लिए कि जीएमएम एल्गोरिदम एक अपर्याप्त समाधान तक नहीं पहुंच पाया है, आपको प्रत्येक घटक के लिए भिन्नताएं देखना चाहिए। यदि किसी भी प्रकार का शून्य शून्य के करीब है, तो यह बुरा है। एक विकल्प के रूप में, आपको अधिकतम संभावना अनुमान के बजाय बेयसियन मॉडल का उपयोग करना चाहिए (यदि आप पहले से ऐसा नहीं कर रहे हैं)।

+0

पर बग की रिपोर्ट कर सकते हैं हाय, उत्तर के लिए धन्यवाद, क्या आप degenerated covariance matrix पर अधिक समझा सकते हैं? यह कैसे हो सकता है? क्या इसका मतलब है कि मेरा डेटा मुख्य रूप से आर^एन के कुछ उप-स्थान पर स्थित है ताकि कुछ धुरी के साथ भिन्नता शून्य के करीब हो? – Jing

+0

हां - आपका डेटा कम आयामी उप-स्थान फैल सकता है या मिश्रण घटकों में से एक को एक डेटा बिंदु पर केंद्रित किया जा सकता है। यह देखने के लिए जांचें कि क्या कॉन्वर्सिस मैट्रिस के किसी भी eigenvalues ​​शून्य के करीब हैं। – user1149913