2011-08-31 11 views
10

यदि आपने खोज एपीआई में कोई गंभीर शोध किया है, तो आप जानते हैं कि उनमें से अधिकतर टीओएस/टीओयू प्रतिबंधों की एक बड़ी संख्या में हैं जो उन्हें किसी भी चीज़ में उपयोग करने के लिए लगभग असंभव बनाते हैं लेकिन सबसे अनावश्यक अनुप्रयोगों में।क्या मुफ्त/भुगतान खोज एपीआई प्रोग्रामेटिक क्वेरीिंग और कैशिंग/परिणामी डेटा के भंडारण के लिए अनुमति देता है?

बिंग का 2.0 एपीआई, याहू खोज बॉस, Google स्थल, Google AJAX खोज (मृत), et al, हमारे लिए बहुत ही सीमित हैं। मुझे केवल एक बार सीमित और अपेक्षाकृत छोटी संख्या में प्रश्न (शायद 500k) चलाने की आवश्यकता है, हमारे आवेदन के भीतर परिणामों के विशिष्ट परिणामों को संग्रहित करना।

उदाहरण के लिए, हमें अपनी लक्षित वेबसाइटों के साथ व्यावसायिक नामों का मिलान करना होगा (यदि आवश्यक हो तो हमने परिणामों के एक सेट से 'सर्वश्रेष्ठ अनुमान' बनाने के लिए एल्गोरिदम लिखा है; हमें केवल वेनिला परिणाम सेट की आवश्यकता है)। साथ ही, हमें इस कंपनी के प्रश्न में एक पते से मेल खाना जरूरी है।

दुर्भाग्यवश, मुझे शून्य खोज एपीआई मिल सकती है जो हमें प्रोग्रामेटिक, गैर-उपयोगकर्ता द्वारा शुरू की गई तरीके से क्वेरी को बंद करने की अनुमति देगी।

हम इस तरह के डेटा तक पहुंच के लिए किसी को ठंडा, कठिन नकद देने के लिए भी उत्सुक हैं; Google, बिंग, याहू, और अन्य बस हमारे पैसे नहीं चाहते हैं (जैसा कि उनके TOSes द्वारा प्रमाणित है) ...

कोई विचार?

+0

हाय, सबको! मैं देखता हूं कि इसे एक करीबी वोट मिला है। यदि कोई ऐसा समुदाय है जो इस प्रश्न के लिए अधिक उपयुक्त होगा, तो कृपया मुझे बताएं। मैं ईमानदारी से उन सभी के माध्यम से देखा, और मूल एसओ उचित सबसे प्रासंगिक लग रहा था। धन्यवाद! :) – rinogo

+0

क्या आपने ब्लेको की कोशिश की है? आपका क्या मतलब है "मुझे शून्य खोज एपीआई मिल सकती है जो हमें प्रोग्रामेटिक, गैर-उपयोगकर्ता द्वारा शुरू की गई तरीके से प्रश्नों को बंद करने की अनुमति देगी"? Google के कस्टम सर्च इंजन के आस-पास एक चर्चा हुई जिसमें पूरे वेब को खोजने की संभावना है (साइट जोड़ना और इसे बाद में हटा देना)। इसके अलावा आप कस्टम सर्च इंजन के लिए "क्रेडिट" खरीद सकते हैं, हालांकि कुछ उपयोगकर्ता को उस मामले में भी सीमा मिली है। वैसे भी, मैं वर्तमान खोज एपीआई की सीमाओं के आस-पास अपना बिंदु समझता हूं, और Google सबसे अच्छा खोज इंजन है, भले ही अन्य प्रतिस्पर्धा करते हैं कि किसी के पास कोई बड़ी अनुक्रमणिका नहीं है। –

+0

आपकी प्रतिक्रिया के लिए बहुत बहुत धन्यवाद, sw। आपके सुझाव से संकेत दिया, मैंने ब्लेको की जांच की, और उनका टीओयू भी काफी प्रतिबंधित है। (हालांकि, समय के लिए, ब्लेको एपीआई के लिए आशा की चमक है: http://dev-ops.net/2011/02/02/blekko-search-engine-with-some-nice-features/) Google का सीएसई हमारे लिए काम नहीं करेगा; हम अल्पकालिक, कानूनी रूप से संदिग्ध पैच के बजाय दीर्घकालिक वैध समाधान पसंद करते हैं। हमारे पास पैसा है और इसके साथ भाग लेने के लिए तैयार हैं! :) हमारे जैसे वैध व्यावसायिक जरूरतों के साथ इकाइयों को समायोजित करने के इच्छुक बड़े नामों में से कोई भी क्यों नहीं है? – rinogo

उत्तर

3

अमेज़ॅन ईसी 2 पर होस्ट किए गए 5 अरब वेब पेजों, उनके पेज रैंक, उनके लिंक ग्राफ़ और अन्य मेटाडाटा का एक स्वतंत्र रूप से सुलभ सूचकांक।

http://commoncrawl.org/

उनकी सेवा (या TOU) की शर्तें भी बहुत उचित और अप्रतिबंधित हैं:

http://commoncrawl.org/about/terms-of-use/

+0

इस में बहुत कुछ नहीं देखा है (यह आवश्यकताओं को पूरा कर सकता है, सुनिश्चित नहीं है); मैंने सोचा कि मैं इसे एक टिप्पणी के रूप में जोड़ूंगा: http://80legs.com/ – rinogo

0

आप कुछ दृश्य बुनियादी मैं Bing Ad Intelligence के साथ प्रयोग करना सुझाव देंगे पता है। यह एक नि: शुल्क एक्सेल प्लगइन है और आपको इसका उपयोग करने की ज़रूरत है एक मुफ्त माइक्रोसॉफ्ट खाता है।

क्वेरी सीमा प्रति प्रश्न 20,000 शब्द है। आप क्लिक, इंप्रेशन, सीटीआर, सीपीसी, औसत बोली और कुल लागत पर जानकारी प्राप्त कर सकते हैं। यदि आप अधिक उन्नत कीवर्ड शोध सुविधाओं का उपयोग करते हैं तो क्वेरी सीमा थोड़ी कम है।

 संबंधित मुद्दे

  • कोई संबंधित समस्या नहीं^_^