2009-01-29 3 views
9

कोई भी किसी पार्क किए गए वेब पेज को प्रोग्रामेटिक रूप से पहचानने का तरीका जानता है? यही वह पृष्ठ है जिसे आपने गलती से टाइप किया है (या जानबूझकर कभी-कभी) और वे डोमेन पार्किंग सेवा द्वारा होस्ट किए जाते हैं, लेकिन उनके विज्ञापनों पर कुछ भी नहीं है।पार्क किए गए पृष्ठ का पता लगाने का तरीका?

मैं एक लिंकिंग नेटवर्क पर काम कर रहा हूं और यह सुनिश्चित करना चाहता हूं कि समाप्त होने वाली साइटें किसी और द्वारा छीनने और फिर पार्क किए जाने वाले पृष्ठ पर न हो जाएं।

उत्तर

10

यहां एक परीक्षण है जो मुझे लगता है कि उनमें से एक सभ्य संख्या प्राप्त हो सकती है। यह इस तथ्य का लाभ उठाता है कि आप वास्तव में अपने पार्क किए गए डोमेन के लिए असली वेब साइट नहीं चाहते हैं। यह सबडोमेन और पथ दोनों के वाइल्डकार्डिंग की तलाश में है। आइए मान लें कि हमारे पास हमारे सिस्टम

http://www.example.com/method-to-detect-parked में यह यूआरएल है।

सबसे पहले मैं वास्तविक यूआरएल जांचता हूं और इसे हैश करता हूं या तुलना के लिए एक प्रतिलिपि लेता हूं।

मेरी दूसरी जांच होगी

http://random.example.com/random

यह मूल लिंक से मेल खाता है या यहां तक ​​कि सफल होती है, तो आप एक बहुत अच्छा संकेत है कि पेज पार्क की गई है है। यदि यह विफल रहता है तो मैं अलग-अलग सबडोमेन और पथ दोनों को देख सकता हूं। यदि पृष्ठ कुछ तत्वों को यादृच्छिक रूप से बदलता है, तो आप तुलना करने के लिए कुछ आइटम चुनना चाहेंगे। उदाहरण के लिए पृष्ठ में शामिल लिंक की एक सूची बनाएं और उन लोगों की तुलना करें या शायद शीर्षक टैग।

7

मैं कहूंगा कि आपको प्रश्नों और/या पृष्ठों की वास्तविक सामग्री के लिए WHOIS रिकॉर्ड्स की जांच करनी होगी और "पार्क किए गए पृष्ठ" के रूप में कुछ ह्युरिस्टिक्स विकसित करना होगा।

उनके WHOIS रिकॉर्ड को देखकर goooogle.com ले लो, पता चलता है कि वे द्वारा "गोपनीयता संरक्षण" स्वामित्व में हैं और है कि उनके डीएनएस सर्वर Ns1 भी कर रहे हैं/ns2.fastpark.net। यदि आप साइट के स्रोत को देखते हैं, तो वे "style_park.css" नामक एक सीएसएस फ़ाइल के लिए मूर्ख हैं :)

सब कुछ, मुझे नहीं लगता कि आप साथ आने में सक्षम होंगे ऐसा करने का एक सामान्य तरीका। आप शायद कुछ विकसित डोमेन बेस या ब्लैकलिस्ट

+0

ब्लैकलिस्ट और नियमों के विचार के साथ बेहतर अवसर हो सकता है ... यदि आप डेटा कचरे को देखते हैं तो प्रोग्रामिक रूप से यह पता लगाना बहुत मुश्किल है, लेकिन आप अभी भी फाइलों में अद्वितीय पैटर्न (सामान्य सीएसएस नियम, छवियों, आदि)। – David

2

आप बस अपने उपयोगकर्ताओं पर "इस लिंक की रिपोर्ट करें" पर भरोसा कर सकते हैं ... जो इसे बाद में समीक्षा करने के लिए कतार में डाल देगा?

1

डीएनएस/जोइस रिकॉर्ड की निर्माण तिथि को देखें, और इसकी तुलना लिंक की अतिरिक्त तिथि से करें। यदि DNS नया है, तो यह एक लिंक है जिसे मैन्युअल जांच की आवश्यकता है।

या: http://example.com/ और http://example.com/xxxxxxrandomstringxxxxx देखें। यदि वे दो पृष्ठ समान हैं, तो आपको कुछ प्रकार की समस्या है जिसके लिए मैन्युअल जांच की आवश्यकता है। या तो प्राथमिक पृष्ठ जिसे आप लिंक करना चाहते हैं टूटा हुआ है, या डोमेन पार्क किया गया है और सभी पृष्ठ समान मान लौटाते हैं। यह परीक्षण 100% नहीं है, क्योंकि कुछ पार्क किए गए पृष्ठ URL से तत्वों को प्रतिबिंबित करते हैं।

यदि आप सिर्फ मौजूदा वेबसाइट की जांच करना चाहते हैं, तो http://www.linkalarm.com/ जैसी कोई सेवा अच्छी तरह से करती है।