मैं एक अनुशंसाकर्ता प्रणाली बनाने की कोशिश कर रहा हूं जो उपयोगकर्ता को अपने कार्यों के आधार पर वेबपृष्ठों की अनुशंसा करेगा (Google खोज, क्लिक, वह स्पष्ट रूप से वेबपृष्ठों को भी रेट कर सकता है)। Google समाचार के तरीके के बारे में एक विचार प्राप्त करने के लिए, यह किसी विशेष विषय पर वेब से समाचार लेख प्रदर्शित करता है। तकनीकी शर्तों में जो क्लस्टरिंग है, लेकिन मेरा लक्ष्य समान है। यह उपयोगकर्ता की कार्रवाई के आधार पर सामग्री आधारित सिफारिश होगी।वेब पेज अनुशंसा प्रणाली
तो मेरी प्रश्न हैं:
- कैसे मैं संभवतः इंटरनेट ट्राउल संबंधित वेब पृष्ठों को खोजने के कर सकते हैं?
- और वेब पेज से डेटा निकालने के लिए मुझे किस एल्गोरिदम का उपयोग करना चाहिए पाठपरक विश्लेषण और शब्द आवृत्ति इसे करने का एकमात्र तरीका है?
- आखिरकार इस समस्या के लिए कौन सा मंच सबसे उपयुक्त है। मैंने अपाचे महोत्सव के बारे में सुना है और यह कुछ पुनः उपयोग करने योग्य अल्गोस के साथ आता है, क्या यह एक अच्छा फिट जैसा लगता है?
आपके पास अपने प्रश्न के बारे में कई किताबें लिख सकते हैं। –
हाहा, क्या वे बड़ी समस्याओं की तरह लगते हैं? खैर मैं एक साधारण समाधान की तलाश में हूं। इस तरह के एक परियोजना से संपर्क करने के बारे में बस एक संक्षिप्त विवरण। –
[प्रोग्रामिंग सामूहिक खुफिया] (http://shop.oreilly.com/product/9780596529321.do) मशीन लर्निंग के लिए एक आसान, गणित-कम परिचय है और आपके प्रश्न की तरह उपयोग-केस शामिल है। – Maurits