2010-05-22 13 views
9

डेटा खनन के क्षेत्र में, 'समानता' नामक एक विशिष्ट उप-अनुशासन है? यदि हां, तो इससे क्या निपटता है। कोई भी उदाहरण, लिंक, संदर्भ सहायक होंगे।'समानता'

इसके अलावा, क्षेत्र में नया होने के नाते, मैं समुदाय की राय चाहता हूं कि डेटा खनन और आर्टिफिशियल इंटेलिजेंस कितनी करीब से संबंधित है। क्या वे समानार्थी हैं, क्या दूसरे का उप-समूह है?

आपके ज्ञान को साझा करने के लिए अग्रिम धन्यवाद।

+0

संबंधित: http://stackoverflow.com/questions/3007790/ खोज-निकटतम-मिलान – Betamoo

उत्तर

9

डेटा खनन के क्षेत्र में, 'समानता' नामक एक विशिष्ट उप-अनुशासन है?

हां। डेटा खनन और मेट्रिक लर्निंग नामक मशीन लर्निंग में एक विशिष्ट उप-क्षेत्र है, जिसका उद्देश्य डेटा उदाहरणों के बीच बेहतर दूरी मीट्रिक सीखना है।

क्या आप निम्न में से कोई भी अवधारणा जानते हैं?

Euclidean distance

Mahalanobis distance

Pearson correlation

Cosine similarity और here

कर्नेल कार्यों

आप इन पता करने के बाद, आपको पता चलेगा कि क्या 'समानता' है।

मैं समुदाय की राय चाहता हूं कि डेटा खनन और आर्टिफिशियल इंटेलिजेंस कितनी करीब से संबंधित है।

डेटा खनन क्या है, यह अंतर करना बहुत मुश्किल है, एआई क्या है। इस सवाल पर चर्चा न करें जब आप मैदान में नए हों। जब आपने डेटा खनन में 10 एल्गोरिदम सीखे हैं और कुछ एआई किताबें पढ़ी हैं, तो आप अंतर और संबंध जान लेंगे।

2

'समानता' की उचित परिभाषाएं (जो आप निकालेंगे, आप बाद में उनके साथ क्या करते हैं) क्लस्टरिंग की परिभाषा लगभग हैं, और क्लस्टरिंग डेटा खनन का एक काफी व्यापक उप-क्षेत्र है।

यदि आप एआई की मानक क्रांतिकारी परिभाषा को समस्याओं के सेट के रूप में बनाते हैं तो हम अच्छी तरह से हल नहीं कर सकते हैं (वास्तव में, हम हल करने के लिए पर्याप्त रूप से निर्दिष्ट नहीं कर सकते हैं), डेटा खनन उस स्थान पर एक बार उसमें छाया डालता है आप देख रहे हैं कि सहसंबंध आपके एल्गोरिदम से संभाल सकते हैं।

2

बस "समानता" अवधारणा के महत्व पर जोर देने के लिए।

डेटा खनन (एआई, मशीन लर्निंग, मॉडलिंग इत्यादि) कुछ फ़ंक्शन को अधिकतम या न्यूनतम मान में लाने के बारे में है। सर्वश्रेष्ठ अनुकूलन/सीखना/खनन एल्गोरिदम और गलत कार्य करें और आपको एक पूर्ण कचरा मिल जाए। ध्यान दें कि हम "मान" का उपयोग करते हैं और "मान" नहीं। ऐसा इसलिए है क्योंकि कोई (मेरे सर्वोत्तम ज्ञान के लिए) एल्गोरिदम (कम्प्यूटेशनल या अन्य) नहीं है जो एक से अधिक मान को अनुकूलित करने में सक्षम है। हालांकि, हमारे ब्रह्मांड में, जटिल अनुकूलन एक-आयामी वाले (हम अमीर और युवा और स्वस्थ होना चाहते हैं) से अधिक बार होते हैं। यही कारण है कि समानता और अन्य स्कोरिंग कार्यों की एक बड़ी संख्या मौजूद है।और यही कारण है कि उनमें से कोई भी "सही" नहीं है

1

समानता एक अवधारणा है जिसका उपयोग क्लस्टरिंग, वर्गीकरण जैसे कई डेटा खनन कार्यों में किया जाता है। आप डेटा की किस तरह पर Dependings, आप इस तरह के पाठ दस्तावेज़ों के लिए कोज्या समानता, Euclidian दूरी, आदि के रूप में विभिन्न समानता उपायों का इस्तेमाल किया हो सकता है

0

डाटा खनन में इस्तेमाल समानता माप के बहुत सारे हैं। पाठ खनन के लिए, ग्रंथों में समानता, कोसाइन समानता, Jaccard समानता व्यापक रूप से इस्तेमाल

संदर्भ के लिए लगता है, आप राघवन और amnnings सूचना पुनर्प्राप्ति किताब देख सकते हैं