2008-11-17 15 views
10

वर्तमान में मेरे पास दो मीडियाविकिस हैं, जो कि दूसरे की तुलना में थोड़ा पुराना संस्करण है। मैं डुप्लिकेट पृष्ठों को खत्म किए बिना दोनों की सामग्रियों को मर्ज करना चाहता हूं। अब तक का सबसे अच्छा विकल्प मैं सोच सकता हूं कि एक विकी के सभी पृष्ठों के माध्यम से एक बॉट (जैसे प्विकिपीडिया) का उपयोग करना है, और डुप्लिकेट पृष्ठों का नाम बदलने के लिए उन्हें दूसरे में डालने का प्रयास करना है।मीडियाविकी सामग्री को एक साथ मिलाकर

यह समाधान ऐसा लगता है कि इसे पूरा करने में कुछ समय लगेगा। क्या ऐसा करने का एक और सुखद तरीका है कि मैं सिर्फ अनजान हूं? मैंने मीडियाविकि डेटाबेस के साथ सीधे काम नहीं किया है, इसलिए मैं यह जानने के बिना बहुत सहज महसूस नहीं कर रहा हूं कि मैं क्या कर रहा हूं।

उत्तर

8

मीडियाविकि में import और export विशेषताएं हैं, जिनका उपयोग आप सामग्री को स्थानांतरित करने के लिए कर सकते हैं। यह मौजूदा पृष्ठों के इतिहास को विलय करता है (आयात लिंक देखें)।

हालांकि, यह एक ही नाम के साथ दो अलग-अलग पृष्ठों के विवादों को संभाल नहीं करता है, इसलिए आपको पृष्ठों को अपने आप से ले जाना होगा। जहां तक ​​मैं MediaWiki page table के विवरण में देख सकता हूं, आप सीधे SQL में डुप्लिकेट पृष्ठों को ढूंढ और नाम बदल सकते हैं, लेकिन pywikipedia को भी काम करना चाहिए (लेकिन आपको रीडायरेक्ट को हटाना होगा जो "सही" पृष्ठ चाल के परिणामस्वरूप होंगे, अन्यथा वे अन्य विकी से आयातित पृष्ठों के साथ गड़बड़ करेंगे)।

+0

मैं सहमत हूं - जब तक कि कई सौ डुप्लिकेट पेज नहीं होने जा रहे हैं, तो मैं XML आयात/निर्यात सुविधा का उपयोग करने की अनुशंसा करता हूं। – HanClinto

+0

जो मैं आयात सुविधा के बारे में देखता हूं, ऐसा लगता है कि यह फ़ाइलों के छोटे सेटों के लिए उपयोगी है, लेकिन बड़े सेट के लिए उपयोगी नहीं है। ऐसा लगता है कि डुप्लिकेट पृष्ठों को उपयोगकर्ता द्वारा संभाला जाना है, और अनुकूलन आयात विकल्प सीमित दिखते हैं। अभी, पाइविकिपीडिया सबसे अच्छा विकल्प दिख रहा है ... – spelchec