एक परियोजना के प्रकाश में मैं पायथन एनएलटीके और दस्तावेज़ वर्गीकरण और बेवकूफ बेयस वर्गीकृत के साथ खेल रहा हूं। जैसा कि मैं प्रलेखन से समझता हूं, यह आपके काम को बहुत अच्छी तरह से काम करता है यदि आपके अलग-अलग दस्तावेजों को लेबल या (2 से अधिक लेबल)एनएलटीके: लेबल के बजाय संख्यात्मक स्कोर के साथ दस्तावेज़ वर्गीकरण
जिन दस्तावेज़ों के साथ मैं काम कर रहा हूं, वे पहले ही वर्गीकृत नहीं हैं लेबल हैं, लेकिन उनके पास स्कोर है, 0 और 5.
मैं जो करना चाहता हूं वह एक वर्गीकरण का निर्माण करना है, जैसे प्रलेखन में फिल्मों की उदाहरण, लेकिन यह एक टुकड़े के स्कोर की भविष्यवाणी करेगा लेबल के बजाय पाठ। मेरा मानना है कि इस दस्तावेज़ में उल्लेख किया गया है लेकिन
मैं भाषा विशेषज्ञ नहीं हूं और न ही सांख्यिकीविद हूं, इसलिए यदि किसी के पास इस झूठ बोलने का उदाहरण है तो मैं सबसे अधिक आभारी हूं यदि आप चाहेंगे इसे मेरे साथ साझा करें। धन्यवाद!
एनएलटीके से बहुत परिचित नहीं है, लेकिन एक बेवकूफ बेयस वर्गीकृत में लेबल सीधे संभावना से संबंधित है। तो, कहीं एनएलटीके कोड में, एक संभाव्यता की गणना की जाती है, और यह निर्भर करता है कि क्या संभावना थ्रेसहोल्ड मान से ऊपर या नीचे है, एक लेबल लागू होता है। –