जेनेरिक कोड डुप्लिकेशन पहचान उपकरण

मैं एक कोड डुप्लिकेशन उपकरण की तलाश में हूं जो भाषा अज्ञेयवादी है। भाषा विशिष्ट कोड डुप्लिकेशन उपकरण (जावा, सी, पीएचपी, ... के लिए) ढूंढना आसान है, लेकिन मैं एक कस्टम वाक्यविन्यास में टेम्पलेट्स पर कुछ कोड डुप्लिकेशन विश्लेषण चलाने के लिए चाहता हूं।जेनेरिक कोड डुप्लिकेशन पहचान उपकरण

मुझे वाक्यविन्यास के उन्नत पार्सिंग की परवाह नहीं है, केवल सीधी रेखा आधारित कच्ची स्ट्रिंग तुलना ठीक है। व्हाइटस्पेस असंवेदनशील मिलान एक प्लस होगा, लेकिन आवश्यक नहीं है। (व्हाइटस्पेस को सामान्यीकृत/खत्म करना मुश्किल नहीं है।)

क्या कोई ऐसे उपकरण को जानता है जो इस तरह के लिए उपयोग किया जा सकता है (गलत)?

धन्यवाद।

स्रोत

2012-11-15 Stefaan

पर एक नज़र ले जा सकते हैं डिटेक्टर भाषा सिंटैक्स के बारे में कुछ भी नहीं जानता है, तो आप गरीब क्लोन का पता लगाने मिलता है। अधिकांश क्लोन समान पाठ नहीं होते हैं; वे कॉपी-पेस्ट- * संपादित * टेक्स्ट हैं, इसलिए उन्हें सटीक रूप से ढूंढने के लिए आपको * समान * मिलान करने की आवश्यकता है लेकिन समान कोड टुकड़े नहीं हैं। सिंटैक्स-जागरूक क्लोन डिटेक्टर हैं, और कम या अधिक डिग्री के लिए, उन्हें सटीक लैंगेज सिंटैक्स जानने के लिए कॉन्फ़िगर किया जा सकता है। –

संभावित डुप्लिकेट [फ़ाइलों में समानताएं दिखाने के लिए युक्तियाँ] (http://stackoverflow.com/questions/1536643/tips-to-show-similarities-in-files) –

मुझे सच में लगता है कि आप तर्क डुप्लिकेशन पर सबसे अच्छा ध्यान केंद्रित करेंगे कच्चे स्ट्रिंग डुप्लिकेशन के बजाय। कुछ भाषाएं बॉयलर-प्लेटी हो सकती हैं लेकिन उस तरह की नकल बग को डुप्लिकेट नहीं करती है। यह तब होता है जब आपके पास सिस्टम के दो स्थानों में एक ही, गैर-तुच्छ तर्क होता है जो अनावश्यक रखरखाव बोझ का कारण बनता है। –

Simian पर एक नज़र डालें, आप इसका उपयोग जावा, सी #, सी, सी ++, कोबोल, रूबी, जेएसपी, एएसपी, एचटीएमएल, एक्सएमएल, विजुअल बेसिक, ग्रोवी स्रोत कोड और यहां तक कि सादे पाठ फ़ाइलों के लिए भी कर सकते हैं।

इसके अलावा, एक समान प्रश्न here।

स्रोत

2012-11-15 13:40:31 Doon

सिमियन ऐसा लगता है जो मैं खोज रहा हूं, धन्यवाद। – Stefaan

तुम भी सोनार http://www.sonarsource.org/

स्रोत

2013-06-10 14:38:40

जेनेरिक कोड डुप्लिकेशन पहचान उपकरण

उत्तर

संबंधित मुद्दे