मेरी साइट बड़ी हो रही है और यह विभिन्न चैनलों के माध्यम से बहुत से स्पैम को आकर्षित करना शुरू कर रही है। साइट में कई प्रकार के यूजीसी (प्रोफाइल, फ़ोरम, ब्लॉग टिप्पणियां, स्थिति अपडेट, निजी संदेश इत्यादि) हैं। मेरे पास विभिन्न शमन प्रयास चल रहे हैं, जो मुझे स्पैमर को मनाने के लिए ब्लिट्जक्रेग फैशन में तैनात होने की उम्मीद है कि हम एक सार्थक लक्ष्य नहीं हैं। मुझे विश्वास है कि मैं कार्यक्षमता के अनुसार क्या कर रहा हूं, लेकिन एक गायब टुकड़ा सभी पुराने स्पैम को एक बार में मार रहा है।एक बड़ी रेल साइट पर लचीला स्पैम पहचान बनाने के लिए एक अच्छा ओपन सोर्स पैकेज क्या है?
यहाँ मैं क्या है:
- बड़े अच्छे/बुरे कॉर्पोरा (5-आंकड़ा बुरा, 6 या 7-आंकड़ा अच्छा)। बहुत सारे स्पैम के पास बहुत विश्वसनीय फिंगरप्रिंट हैं, और तथ्य यह है कि मैंने 6 महीनों के लिए इसे अनदेखा कर दिया है :)
- एडब्ल्यूएस पर तैनात बड़ी, मॉड्यूलर रेल साइट। यह एक बड़ी यातायात साइट नहीं है, लेकिन हम एसओए की शुरुआत के साथ 8 उदाहरण चला रहे हैं।
- रूबी, Redis, Resque, MySQL, वार्निश, Nginx, यूनिकॉर्न, बावर्ची, Gentoo पर सभी
मेरे आवश्यकताओं:
- मैं इसे काफी अच्छा की मात्रा को देखते हुए निष्पादित करना चाहते हैं डेटा (इसलिए मैं शुद्ध रूबी समाधान से सावधान हूं)।
- मुझे विभिन्न प्रकार की सामग्री (41 9-घोटाले बनाम बॉटनेट लिंक स्पैम) में कई वर्गीकरणों को प्रशिक्षित करने में सक्षम होना चाहिए
- मैं अपने स्वयं के जासूसी कार्य (पैटर्न मिलान, आईपी पुन: उपयोग के आधार पर मैन्युअल कारकों को जोड़ने में सक्षम होना चाहता हूं) , आदि)
- आखिरकार मैं रुबी के साथ उपयोग करने के लिए एक अच्छा इंटरफ़ेस बनाना चाहता हूं। अगर इसे सी या जो कुछ भी मेरे हाथों में गंदे होने की आवश्यकता है, तो मैं इसे संभाल सकता हूं, लेकिन यदि मैं कर सकता हूं तो मैं इससे बच जाऊंगा।
मुझे एहसास है कि यह एक लंबा और अस्पष्ट सवाल है, लेकिन जो मैं मुख्य रूप से खोज रहा हूं वह केवल अच्छे पैकेजों की एक सूची है, और दूसरी बात यह है कि किसी ऐसे व्यक्ति से कोई यादृच्छिक विचार जिसने इसे देखने के तरीकों के बारे में एक समान प्रणाली बनाई है ।
निश्चित रूप से एक बात जिसे मैंने माना। मैं इसके प्रदर्शन और सापेक्ष लागत पर सवाल करता हूं, विशेष रूप से विभिन्न निगमों पर विचार करना, मैं विभिन्न उद्देश्यों के लिए ट्रेन करना चाहता हूं। शायद मैं गुमराह हूं, लेकिन मैं इस पल के लिए अपना खुद का रोल रखना चाहता हूं ... – gtd