tf-idf

    14गर्मी

    3उत्तर

    मैं काम करने की कोशिश कर रहा हूं कि सोलर खोज परिणामों के स्कोरिंग में सुधार कैसे किया जाए। मेरे आवेदन को सोलर परिणामों से स्कोर लेने की आवश्यकता है और परिणाम के परिणामस्वरूप कितने अच्छे हैं इस पर निर्

    5गर्मी

    3उत्तर

    मैंने दो दस्तावेजों के टीएफ/आईडीएफ मूल्यों की गणना की। 1.txt 0.0 0.5 2.txt 0.0 0.5 दस्तावेजों की तरह हैं: 1.txt = > dog cat 2.txt = > cat elephant मैं इन मूल्यों का उपयोग कैसे कोज्या समानता

    6गर्मी

    1उत्तर

    ठीक है तो मैं थोड़ा उलझन में हूं। हालांकि यह एक सरल सीधा सवाल होना चाहिए। array([[ 0.85..., 0. ..., 0.52...], [ 1. ..., 0. ..., 0. ...], [ 1. ..., 0. ..., 0. ...], [ 1. ..., 0. ...,

    12गर्मी

    1उत्तर

    ठीक है के लिए * आईडीएफ, तो मैं TF * आईडीएफ पर इन दो पदों निम्नलिखित किया गया है लेकिन बहुत कम भ्रमित कर रहा हूँ: http://css.dzone.com/articles/machine-learning-text-feature मूल रूप से, मुझे लगता है कि

    6गर्मी

    1उत्तर

    शब्द आवृत्तियों (टीएफ), और व्यस्त दस्तावेज़ आवृत्ति (आईडीएफ), स्टॉप-शब्द हटाने और स्टेमिंग से प्रभावित कैसे हैं? धन्यवाद!

    5गर्मी

    2उत्तर

    के लिए कैलकुलेटिंग आईडीएफ (व्यस्त दस्तावेज़ आवृत्ति) दस्तावेज़ वर्गीकरण में आईडीएफ (व्यस्त दस्तावेज़ आवृत्ति) की गणना करने में मुझे संदेह है। मेरे पास प्रशिक्षण के लिए कई दस्तावेजों के साथ एक से अधिक

    45गर्मी

    5उत्तर

    में कोसाइन समानता की सरल कार्यान्वयन मैं एक DB में संग्रहीत दस्तावेज़ों की तुलना और 0 और 1. विधि मैं उपयोग करने के लिए है की जरूरत है जो समानता स्कोर के साथ आने की जरूरत है बहुत आसान होना टी-आईडीएफ और

    24गर्मी

    5उत्तर

    आपके द्वारा पहले दी गई सभी सहायता के लिए धन्यवाद। मुझे अभी एक छोटा सा प्रश्न मिला है जो मुझे भ्रमित करता है। टीएफ-आईडीएफ और कोसाइन समानता। मैं दोनों को और फिर कोसीन समानता के तहत विकी पर पढ़ रहा था, म

    10गर्मी

    3उत्तर

    I'm trying to use TF-IDF। मैं कुछ दस्तावेजों के लिए tf_idf गणना की है, लेकिन अब जब मैं इन दस्तावेजों मैं एक ट्रैस बैक कहावत मिल दोनों के बीच कोसाइन समानता की गणना करने के लिए प्रयास करें: #len(u)==201

    14गर्मी

    1उत्तर

    में काम कर रहे टीएफ-आईडीएफ वेटिंग प्राप्त करने का प्रयास कर रहा हूं, मैं टीएम पैकेज के साथ कुछ बहुत ही बुनियादी पाठ विश्लेषण करने की कोशिश कर रहा हूं और कुछ टीएफ-आईडीएफ स्कोर प्राप्त कर रहा हूं; मैं ओ