में आंशिक मैच के साथ डेटा को मर्ज मैं दो डेटासेटआर
datf1 <- data.frame (name = c("regular", "kklmin", "notSo", "Jijoh",
"Kish", "Lissp", "Kcn", "CCCa"),
number1 = c(1, 8, 9, 2, 18, 25, 33, 8))
#-----------
name number1
1 regular 1
2 kklmin 8
3 notSo 9
4 Jijoh 2
5 Kish 18
6 Lissp 25
7 Kcn 33
8 CCCa 8
datf2 <- data.frame (name = c("reGulr", "ntSo", "Jijoh", "sean", "LiSsp",
"KcN", "CaPN"),
number2 = c(2, 8, 12, 13, 20, 18, 13))
#-------------
name number2
1 reGulr 2
2 ntSo 8
3 Jijoh 12
4 sean 13
5 LiSsp 20
6 KcN 18
7 CaPN 13
है मैं नाम कॉलम के आधार पर उन्हें मर्ज करना चाहते हैं, आंशिक मैच तथापि साथ (बड़े डेटा में वर्तनी त्रुटियों विलय की स्थापना की और भी करने के लिए बाधा से बचने के लिए अनुमति दी है इस तरह के वर्तनी त्रुटियों का पता लगाने) और उदाहरण के लिए
(1) अगर लगातार चार पत्र (पत्रों की संख्या रहे हैं सब करता है, तो कम से कम 4) किसी भी स्थिति में - मेल खाते हैं कि
ABBCD = BBCDK = aBBCD = ramABBBCD = ABB
(2) प्रकरण ठीक है सेन मैच में साइटिविटी बंद है जैसे ABBCD = aBbCd
(3) नए डेटासेट में दोनों नाम (डेटाफ 1 और डेटाएफ 2 से नाम) होंगे। तो यह पत्र हम पता लगा सकते हैं कि मैच सही है (कितना अक्षर मिलान करता है के साथ एक अलग कॉलम हो सकता है)
क्या ऐसा विलय संभव है?
संपादन:
datf1 <- data.frame (name = c("xxregular", "kklmin", "notSo", "Jijoh",
"Kish", "Lissp", "Kcn", "CCCa"),
number1 = c(1, 8, 9, 2, 18, 25, 33, 8))
datf2 <- data.frame (name = c("reGulr", "ntSo", "Jijoh", "sean",
"LiSsp", "KcN", "CaPN"),
number2 = c(2, 8, 12, 13, 20, 18, 13))
uglyMerge(datf1, datf2)
name1 name2 number1 number2 matches
1 xxregular <NA> 1 NA 0
2 kklmin <NA> 8 NA 0
3 notSo <NA> 9 NA 0
4 Jijoh Jijoh 2 12 5
5 Kish <NA> 18 NA 0
6 Lissp LiSsp 25 20 5
7 Kcn KcN 33 18 3
8 CCCa <NA> 8 NA 0
9 <NA> reGulr NA 2 0
10 <NA> ntSo NA 8 0
11 <NA> sean NA 13 0
12 <NA> CaPN NA 13 0
कुछ स्वरूपण को ठीक करने का प्रयास किया। मैं देखता हूं कि आपने "uglyMerge" की एक प्रति जोड़ा है जो @sgibb की प्रतिक्रिया से प्रतीत होता है। 'Rexulr' के साथ 'xxregular' के मिलान की कमी आपके लिए स्पष्ट हो सकती है, लेकिन आपको इसे समझाने की आवश्यकता हो सकती है, क्योंकि ऐसा लगता है कि यह आपके विनिर्देशों को पूरा करता है –