हालांकि मीडियाविकि एक API (api.php
), यह अपने उद्देश्यों के लिए सबसे आसान हो सकता है अगर आप सिर्फ एक संशोधन (एक्सएमएल, JSON, आदि में लिपटे नहीं के स्रोत कोड प्राप्त करना चाहते हैं तो बस index.php
को action=raw
पैरामीटर का उपयोग करना पड़ता है , एपीआई के विपरीत)।
उदाहरण के लिए, इस 14 नवंबर के लिए दिन पेज के कच्चे शब्द है:
http://en.wiktionary.org/w/index.php?title=Wiktionary:Word_of_the_day/November_14&action=raw
क्या दुर्भाग्यपूर्ण है कि विकी पृष्ठों के प्रारूप पर की तुलना में (मानव पाठक के लिए) प्रस्तुति पर केंद्रित है बल्कि है अर्थशास्त्र (मशीन के लिए), इसलिए आपको आश्चर्य नहीं होना चाहिए कि "शब्द परिभाषा प्राप्त करें" API कमांड नहीं है। इसके बजाए, आपकी स्क्रिप्ट को कई टेक्स्ट स्वरूपण टेम्पलेट्स को समझना होगा जो विकिपीडिया संपादकों ने बनाया है और उपयोग किया है, साथ ही साथ जटिल प्रस्तुति स्वरूपण वाक्यविन्यास, शीर्षक, अनॉर्डर्ड सूचियां और अन्य शामिल हैं। उदाहरण के लिए, यहाँ पेज "अतिप्रवाह" के लिए स्रोत कोड है:
http://en.wiktionary.org/w/index.php?title=overflow&action=raw
वहाँ है एपीआई में एक "XML पार्स पेड़ उत्पन्न" विकल्प है, लेकिन यह प्रस्तुतिकरण के बहुत नष्ट नहीं होती है एक्सएमएल में स्वरूपण। बस अपने आप के लिए देखें:
http://en.wiktionary.org/w/api.php?action=query&titles=overflow&prop=revisions&rvprop=content&rvgeneratexml=&format=jsonfm
यदि आप सोच रहे हैं मीडियाविकि प्रारूप अन्य पन्नों मीडियाविकि से के लिए एक पार्सर वहाँ मौजूद है या नहीं, नहीं, वहाँ नहीं है। जावास्क्रिप्ट में कम से कम कुछ भी नहीं लिखा गया है जो वर्तमान में बनाए रखा गया है (list of alternative parsers देखें, और दो सूचीबद्ध लोगों की वेबसाइट देखें)। और फिर भी, अधिकांश/सभी सामान्य टेम्पलेट्स का समर्थन करना एक बड़ी चुनौती होगी। सौभाग्य।
मुझे विश्वास है कि होम पेज पर "दिन का शब्द" बॉक्स की सामग्री इसे संक्षिप्त रखने के लिए मैन्युअल रूप से संपादित की जाती है। शब्द लेख खोलते समय आप उस शब्द के लिए और अधिक अर्थ देखेंगे। –
यह भी देखें http://stackoverflow.com/questions/3364279/has-anyone-parsed-wiktionary – pfctdayelise