मैंने विभिन्न मानक मशीन सीखने के कार्यों को पूर्ववत करने के लिए अमेज़ॅन लोचदार MapReduce के साथ खुद को स्थापित किया है। मैंने अतीत में स्थानीय मशीन सीखने के लिए पायथन का व्यापक रूप से उपयोग किया है और मुझे जावा नहीं पता है।क्या हडोप के साथ पायथन का उपयोग करने के लिए कोई वितरित मशीन लर्निंग लाइब्रेरी है?
जहां तक मैं कह सकता हूं कि वितरित मशीन सीखने के लिए कोई अच्छी तरह से विकसित पायथन पुस्तकालय नहीं हैं। दूसरी ओर जावा Apache Mahout और क्लौडेरा से हाल ही में Oryx है।
अनिवार्य रूप से ऐसा लगता है कि मुझे दो विकल्पों के बीच चयन करना है। Hadoop streaming या Python wrapper for Hadoop में से एक के साथ उपयोग करने के लिए मेरे स्वयं के एल्गोरिदम समानांतर के माध्यम से स्लोग करें, सभ्य पुस्तकालय मौजूद हैं या जावा पर जहाज कूदें ताकि मैं महौत/ओरीक्स का उपयोग कर सकूं। अपने स्वयं के MapReduce शब्द गणना कोड लिखने और अपना खुद का MapReduce SVM लिखने के बीच अंतर की दुनिया है! this जैसे महान ट्यूटोरियल की सहायता से भी।
मैं नहीं जानता कि जो, समझदार पसंद है तो मेरे सवाल यह है:
ए) वहाँ कुछ अजगर पुस्तकालय मैं चूक गए जो उपयोगी होगा है? यदि नहीं, तो क्या आप जानते हैं कि विकास में कोई है जो निकट भविष्य में उपयोगी होगा?
बी) यदि उपर्युक्त का उत्तर नहीं है तो क्या मेरा समय जावा पर जहाज कूदने में बेहतर होगा?
जांचें: http://stackoverflow.com/questions/4819437/javas-mahout-equivalent-in-python – alexplanation
हमें पूछे जाने वाले प्रश्न ** टूल, लाइब्रेरी या पसंदीदा ऑफ़-साइट संसाधन ** की सिफारिश या ढूंढ रहे हैं स्टैक ओवरफ़्लो के लिए ऑफ़-विषय क्योंकि वे राय वाले उत्तरों और स्पैम को आकर्षित करते हैं। इसके बजाए, [समस्या का वर्णन करें] (http://meta.stackexchange.com/q/139399/) और इसे हल करने के लिए अब तक क्या किया गया है। –
[सॉफ्टवेयर सिफारिशें] पर आगे बढ़ें (http://area51.stackexchange.com/proposals/60887/software-recommendations?referrer=L1kFo5C96mMK8IujJZeI4A2) जब इसे खोला जाएगा। – user