11

मैं एक कोड डुप्लिकेशन उपकरण की तलाश में हूं जो भाषा अज्ञेयवादी है। भाषा विशिष्ट कोड डुप्लिकेशन उपकरण (जावा, सी, पीएचपी, ... के लिए) ढूंढना आसान है, लेकिन मैं एक कस्टम वाक्यविन्यास में टेम्पलेट्स पर कुछ कोड डुप्लिकेशन विश्लेषण चलाने के लिए चाहता हूं।जेनेरिक कोड डुप्लिकेशन पहचान उपकरण

मुझे वाक्यविन्यास के उन्नत पार्सिंग की परवाह नहीं है, केवल सीधी रेखा आधारित कच्ची स्ट्रिंग तुलना ठीक है। व्हाइटस्पेस असंवेदनशील मिलान एक प्लस होगा, लेकिन आवश्यक नहीं है। (व्हाइटस्पेस को सामान्यीकृत/खत्म करना मुश्किल नहीं है।)

क्या कोई ऐसे उपकरण को जानता है जो इस तरह के लिए उपयोग किया जा सकता है (गलत)?

धन्यवाद।

+0

पर एक नज़र ले जा सकते हैं डिटेक्टर भाषा सिंटैक्स के बारे में कुछ भी नहीं जानता है, तो आप गरीब क्लोन का पता लगाने मिलता है। अधिकांश क्लोन समान पाठ नहीं होते हैं; वे कॉपी-पेस्ट- * संपादित * टेक्स्ट हैं, इसलिए उन्हें सटीक रूप से ढूंढने के लिए आपको * समान * मिलान करने की आवश्यकता है लेकिन समान कोड टुकड़े नहीं हैं। सिंटैक्स-जागरूक क्लोन डिटेक्टर हैं, और कम या अधिक डिग्री के लिए, उन्हें सटीक लैंगेज सिंटैक्स जानने के लिए कॉन्फ़िगर किया जा सकता है। –

+0

संभावित डुप्लिकेट [फ़ाइलों में समानताएं दिखाने के लिए युक्तियाँ] (http://stackoverflow.com/questions/1536643/tips-to-show-similarities-in-files) –

+0

मुझे सच में लगता है कि आप तर्क डुप्लिकेशन पर सबसे अच्छा ध्यान केंद्रित करेंगे कच्चे स्ट्रिंग डुप्लिकेशन के बजाय। कुछ भाषाएं बॉयलर-प्लेटी हो सकती हैं लेकिन उस तरह की नकल बग को डुप्लिकेट नहीं करती है। यह तब होता है जब आपके पास सिस्टम के दो स्थानों में एक ही, गैर-तुच्छ तर्क होता है जो अनावश्यक रखरखाव बोझ का कारण बनता है। –

उत्तर

8

Simian पर एक नज़र डालें, आप इसका उपयोग जावा, सी #, सी, सी ++, कोबोल, रूबी, जेएसपी, एएसपी, एचटीएमएल, एक्सएमएल, विजुअल बेसिक, ग्रोवी स्रोत कोड और यहां तक ​​कि सादे पाठ फ़ाइलों के लिए भी कर सकते हैं।

इसके अलावा, एक समान प्रश्न here

+0

सिमियन ऐसा लगता है जो मैं खोज रहा हूं, धन्यवाद। – Stefaan