मैं कभी-कभी टेक्स्ट फ़ाइलों के साथ काम कर रहा हूं जिसमें कुछ अनुभागों में एक ही संरचना के साथ कई पैराग्राफ होते हैं।बहु-पंक्ति अर्द्ध-संरचित सामग्री को पार्स और क्वेरी करने का सरल तरीका
Some unrelated preface I'm not interested in... Lorem ipsum dolor sit amet,
consectetur adipiscing elit. Etiam scelerisque.
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Etiam scelerisque. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Etiam scelerisque.
001 [SomeTitle 1] - Some Subtitle 1
Name: SomeName
Area: SomeArea
Content: Some multi-line comment...Lorem ipsum dolor sit amet, consectetur
adipiscing elit. Etiam scelerisque. Lorem ipsum dolor sit amet,
consectetur adipiscing elit. Etiam scelerisque.
002 [SomeTitle 2] - Some Subtitle 2
Name: SomeOtherName
Area: SomeOtherArea
Content: Some other multi-line comment...Lorem ipsum dolor sit amet, consectetur
adipiscing elit.
मैं इस तरह फ़ाइलों क्वेरी करने के लिए एक आसान तरीका के लिए देख रहा हूँ: यहाँ एक उदाहरण है। उदाहरण के लिए, यदि मैं इसे "एरिया: SomeOtherArea" के लिए पूछता हूं, तो परिणाम उस क्षेत्र के साथ फ़ाइल के सभी ब्लॉक होना चाहिए। मेरा मतलब है सभी चार अनुच्छेद: शीर्षलेख, नाम, क्षेत्र, सामग्री। मैं -A और -B विकल्पों के साथ grep का उपयोग कर सकता हूं, लेकिन समस्या यह है कि सामग्री अनुच्छेदों में किसी भी संख्या में रेखाएं हो सकती हैं। और यह सिर्फ यह विशिष्ट उदाहरण है; संरचना पूरी तरह से अलग हो सकती है।
मैं हल्के वजन, आसानी से अनुकूलनीय समाधान की तलाश में हूं, शायद सीएलआई उपकरण का संयोजन। मैं पहिया को फिर से शुरू नहीं करना चाहता हूं।
आपके प्रश्न पर आपके द्वारा निर्दिष्ट प्रत्येक टैग पर अपने माउस पर रोल करें। कुछ में शून्य अनुयायियों हैं। कम से कम लक्ष्य ओएस (यूनिक्स/बनाम/लिनक्स/बनाम/विंडोज़/बनाम/सिगविन/...?) और आपके साथ आरामदायक उपकरण, एक खोल शामिल करने के लिए अपने टैग बदलने के लिए बेहतर है? bash/ksh, और अपने खोज उपकरण grep जोड़ें, ?? अन्य शामिल हैं। सौभाग्य। – shellter