के साथ अपने में scikits सीखने पाइपलाइन, मैं CountVectorizer() के लिए एक कस्टम शब्दावली पारित करने के लिए करना चाहते हैं:Scikits सीखने: उपयोग कस्टम शब्दावली एक साथ पाइपलाइन
text_classifier = Pipeline([
('count', CountVectorizer(vocabulary=myvocab)),
('tfidf', TfidfTransformer()),
('clf', LinearSVC(C=1000))
])
हालांकि, जहां तक मैं समझता हूँ कि जब मैं फोन
text_classifier.fit(X_train, y_train)
पाइपलाइन जो myvocab पर ध्यान नहीं देता CountVectorizer(), की विधि fit_transform() का उपयोग करता है। Myvocab का उपयोग करने के लिए मैं अपनी पाइपलाइन को कैसे संशोधित कर सकता हूं? धन्यवाद!
फिक्स के लिए धन्यवाद! – mathias