मैं एक कोड डुप्लिकेशन उपकरण की तलाश में हूं जो भाषा अज्ञेयवादी है। भाषा विशिष्ट कोड डुप्लिकेशन उपकरण (जावा, सी, पीएचपी, ... के लिए) ढूंढना आसान है, लेकिन मैं एक कस्टम वाक्यविन्यास में टेम्पलेट्स पर कुछ कोड डुप्लिकेशन विश्लेषण चलाने के लिए चाहता हूं।जेनेरिक कोड डुप्लिकेशन पहचान उपकरण
मुझे वाक्यविन्यास के उन्नत पार्सिंग की परवाह नहीं है, केवल सीधी रेखा आधारित कच्ची स्ट्रिंग तुलना ठीक है। व्हाइटस्पेस असंवेदनशील मिलान एक प्लस होगा, लेकिन आवश्यक नहीं है। (व्हाइटस्पेस को सामान्यीकृत/खत्म करना मुश्किल नहीं है।)
क्या कोई ऐसे उपकरण को जानता है जो इस तरह के लिए उपयोग किया जा सकता है (गलत)?
धन्यवाद।
पर एक नज़र ले जा सकते हैं डिटेक्टर भाषा सिंटैक्स के बारे में कुछ भी नहीं जानता है, तो आप गरीब क्लोन का पता लगाने मिलता है। अधिकांश क्लोन समान पाठ नहीं होते हैं; वे कॉपी-पेस्ट- * संपादित * टेक्स्ट हैं, इसलिए उन्हें सटीक रूप से ढूंढने के लिए आपको * समान * मिलान करने की आवश्यकता है लेकिन समान कोड टुकड़े नहीं हैं। सिंटैक्स-जागरूक क्लोन डिटेक्टर हैं, और कम या अधिक डिग्री के लिए, उन्हें सटीक लैंगेज सिंटैक्स जानने के लिए कॉन्फ़िगर किया जा सकता है। –
संभावित डुप्लिकेट [फ़ाइलों में समानताएं दिखाने के लिए युक्तियाँ] (http://stackoverflow.com/questions/1536643/tips-to-show-similarities-in-files) –
मुझे सच में लगता है कि आप तर्क डुप्लिकेशन पर सबसे अच्छा ध्यान केंद्रित करेंगे कच्चे स्ट्रिंग डुप्लिकेशन के बजाय। कुछ भाषाएं बॉयलर-प्लेटी हो सकती हैं लेकिन उस तरह की नकल बग को डुप्लिकेट नहीं करती है। यह तब होता है जब आपके पास सिस्टम के दो स्थानों में एक ही, गैर-तुच्छ तर्क होता है जो अनावश्यक रखरखाव बोझ का कारण बनता है। –