2009-11-24 4 views
39

पार्सिंग कुछ ऐसा है जो मैं विकास में बहुत से आया था, लेकिन जूनियर के रूप में यह उन चीजों में से एक है जो मुझे लगता है कि जब मुझे इसकी आवश्यकता होती है तो मुझे कुछ बिंदु पर लटका दिया जाएगा। मेरे वर्तमान प्रोजेक्ट में मुझे एक निश्चित फ़ंक्शन के लिए एक HTML पार्सर खोजने और उपयोग करने के लिए कहा गया है, मुझे वेब पर एक जोड़ा मिला है, लेकिन वास्तव में एक HTML पार्सर क्या करता है? और किसी ऑब्जेक्ट को पार्स करने का क्या अर्थ है ??पार्सिंग क्या है?

+1

मुझे लगता है [यह विकिपीडिया लेख] (http: //en.wikipedia।संगठन/विकी/पार्सिंग) एक अच्छा प्रारंभिक बिंदु है। – KB22

उत्तर

56

Parsing आमतौर पर पाठ पर लागू होता है - पाठ पढ़ने का कार्य और इसे एक अधिक उपयोगी इन-मेमोरी प्रारूप में परिवर्तित करने, "समझने" का अर्थ कुछ हद तक इसका मतलब है। उदाहरण के लिए, एक XML पार्सर वर्ण (या बाइट्स) के अनुक्रम लेते हैं और उन्हें तत्वों में परिवर्तित कर देंगे, गुण आदि

कुछ मामलों (विशेष रूप से compilers) वहाँ lexical analysis और वाक्यात्मक विश्लेषण के बीच एक जुदाई है, तो असली "में समझना "कच्चे पात्रों की बजाय टोकन (पहचानकर्ता, ऑपरेटरों आदि) के अनुक्रम पर पार्सर कार्यों का हिस्सा।

+2

+1 पाठ्यपुस्तक उत्तर। आपको एक किताब लिखनी चाहिए! : पी – Mike

+5

उसने पहले से ही एक पुस्तक लिखी है। सी # गहराई में – rahul

+0

@ माइक - वह पहले से ही – RobV

8

आप यहां प्रारंभ कर सकते हैं: http://en.wikipedia.org/wiki/Parsing। लघु अंश:

पार्सिंग या वाक्यात्मक विश्लेषण, प्राकृतिक भाषा में या कंप्यूटर भाषाओं में या तो, प्रतीकों में से एक तार का विश्लेषण करने की प्रक्रिया है एक औपचारिक व्याकरण के नियमों के अनुरूप है। पार्सिंग शब्द लैटिन पार्स (ऑरेशनिस) से आता है, जिसका अर्थ भाग (भाषण) है।

+0

हालांकि यह लिंक प्रश्न का उत्तर दे सकता है, यहां उत्तर के आवश्यक हिस्सों को शामिल करना बेहतर है और संदर्भ के लिए लिंक प्रदान करना बेहतर है। लिंक किए गए पृष्ठ में परिवर्तन होने पर लिंक-केवल उत्तर अमान्य हो सकते हैं। – DeanOC

+0

सहमत और किया! – Konamiman

1

यह एचटीएमएल के अंदर टोकन [टैग, विशेषताओं] की पहचान करने की प्रक्रिया है।

8

पार्सिंग डेटा का एक सेट ले रहा है और इससे सार्थक जानकारी निकालने जा रहा है। एचटीएमएल पार्सिंग के साथ, आप कुछ एचटीएमएल पढ़ने और टैग के एक संरचित सेट को देख रहे हैं और

1

कंप्यूटर विज्ञान और भाषाविज्ञान, पार्सिंग, या अधिक औपचारिक रूप से, वाक्य रचनात्मक विश्लेषण में, एक पाठ का विश्लेषण करने की प्रक्रिया है टोकन के एक अनुक्रम (उदाहरण के लिए, शब्दों), किसी दिए गए (अधिक या कम) औपचारिक व्याकरण के संबंध में इसकी व्याकरण संरचना निर्धारित करने के लिए।

: 0)

Wikipedia

3

Parse(computers), by Dictionary.com:

आदेश पात्रों के समूह अंतर्निहित व्याकरण के वाक्यात्मक इकाइयों के साथ संबद्ध करने में (अक्षरों की स्ट्रिंग) का विश्लेषण करने के लिए।

1

कुछ भी लिखने का प्रयास न करें बल्कि खुद को एक छोटा सा पार्सर करें। इस उपयोग के लिए अच्छे उपकरण हैं ANTLR और bison दो हैं जिनके बारे में मैं सोच सकता हूं।

यदि आप उपकरण का उपयोग करते हैं तो आप किसी समस्या को हल करते समय सहायता मांगने में सक्षम होंगे।

चीयर्स, मार्टिन।

4

एक पार्सर एक कंपाइलर/दुभाषिया घटक है जो डेटा को किसी अन्य भाषा में आसान अनुवाद के लिए छोटे तत्वों में विभाजित करता है। एक पार्सर टोकन या प्रोग्राम निर्देशों के अनुक्रम के रूप में इनपुट लेता है और आमतौर पर एक पार्स पेड़ या एक अमूर्त वाक्यविन्यास पेड़ के रूप में एक डेटा संरचना बनाता है।