2012-10-22 4 views
8

एक परियोजना के प्रकाश में मैं पायथन एनएलटीके और दस्तावेज़ वर्गीकरण और बेवकूफ बेयस वर्गीकृत के साथ खेल रहा हूं। जैसा कि मैं प्रलेखन से समझता हूं, यह आपके काम को बहुत अच्छी तरह से काम करता है यदि आपके अलग-अलग दस्तावेजों को लेबल या (2 से अधिक लेबल)एनएलटीके: लेबल के बजाय संख्यात्मक स्कोर के साथ दस्तावेज़ वर्गीकरण

जिन दस्तावेज़ों के साथ मैं काम कर रहा हूं, वे पहले ही वर्गीकृत नहीं हैं लेबल हैं, लेकिन उनके पास स्कोर है, 0 और 5.

मैं जो करना चाहता हूं वह एक वर्गीकरण का निर्माण करना है, जैसे प्रलेखन में फिल्मों की उदाहरण, लेकिन यह एक टुकड़े के स्कोर की भविष्यवाणी करेगा लेबल के बजाय पाठ। मेरा मानना ​​है कि इस दस्तावेज़ में उल्लेख किया गया है लेकिन

मैं भाषा विशेषज्ञ नहीं हूं और न ही सांख्यिकीविद हूं, इसलिए यदि किसी के पास इस झूठ बोलने का उदाहरण है तो मैं सबसे अधिक आभारी हूं यदि आप चाहेंगे इसे मेरे साथ साझा करें। धन्यवाद!

+0

एनएलटीके से बहुत परिचित नहीं है, लेकिन एक बेवकूफ बेयस वर्गीकृत में लेबल सीधे संभावना से संबंधित है। तो, कहीं एनएलटीके कोड में, एक संभाव्यता की गणना की जाती है, और यह निर्भर करता है कि क्या संभावना थ्रेसहोल्ड मान से ऊपर या नीचे है, एक लेबल लागू होता है। –

उत्तर

0

देखना यह एक बहुत ही देर से जवाब है, लेकिन शायद यह किसी को मदद मिलेगी।

आप जो पूछ रहे हैं वह रिग्रेशन है। याकूब के जवाब के बारे में, रैखिक प्रतिगमन इसे करने का एक ही तरीका है। हालांकि, मैं विज्ञान-शिक्षा की उनकी सिफारिश से सहमत हूं।