का उपयोग करके दो दस्तावेज़ों की तुलना करना मैं लाइन ब्रेक के बावजूद दो दस्तावेज़ों की तुलना करना चाहता हूं। यदि सामग्री समान है लेकिन लाइन ब्रेक की स्थिति और मात्रा अलग है, तो मैं लाइनों को एक दस्तावेज़ में दूसरे में लाइनों में मैप करना चाहता हूं।रेगेक्स
को देखते हुए:
दस्तावेज़ 1
I went to Paris in July 15, where I met some nice people.
And I came back
to NY in Aug 15.
I am planning
to go there soon
after I finish what I do.
दस्तावेज़ 2
I went
to Paris
in July 15,
where I met
some nice people.
And I came back to NY in Aug 15.
I am planning to go
there soon after I finish what I do.
मैं एक एल्गोरिथ्म दस्तावेज़ 1 में है कि रेखा 1 का निर्धारण करने में सक्षम चाहते 1 के माध्यम से 5 लाइनों के रूप में एक ही पाठ होता है दस्तावेज़ 2 में, दस्तावेज़ 1 में 2 और 3 पंक्तियों में दस्तावेज़ 2 में पंक्ति 6 के समान टेक्स्ट होता है।
1 = 1,2,3,4,5
2,3 = 6
4,5,6 = 7,8
क्या प्रत्येक दस्तावेज़ में प्रत्येक पंक्ति से मिलान करने के लिए रेगेक्स के साथ कोई तरीका है यदि यह अन्य दस्तावेजों में एकाधिक लाइनों पर फैला हुआ है?
ये संख्याएं क्या हैं? –
एक दृष्टिकोण केवल दोनों इनपुटों को शब्दों में विभाजित करना होगा, वे लाइनों को बनाए रखना होगा, और शब्दों को एक-एक करके मेल करें (मान लें कि शब्द समान हैं)। – nneonneo
प्रत्येक दस्तावेज़ से मेल खाने वाली रेखाएं – hmghaly