2011-10-26 18 views
17

मैं डेटा की एक फ़ाइल को पार्स कर रहा हूं जिसका फ़ील्ड पाइप से अलग हो गया है। रिकॉर्ड न्यूलाइन द्वारा अलग किए जाते हैं। यह एक सीएसवी फ़ाइल या यहां तक ​​कि एक टीएसवी फ़ाइल (http://www.cs.tut.fi/~jkorpela/TSV.html) के समान है, लेकिन मुझे आश्चर्य है कि पाइप सीमित डेटा के लिए स्वीकृत फ़ाइल एक्सटेंशन क्या है?पाइप सीमित फ़ाइलों के लिए उपयोग करने के लिए स्वीकृत फ़ाइल एक्सटेंशन क्या है?

मुझे विशेष रूप से http://en.wikipedia.org/wiki/Delimiter-separated_values में उल्लिखित एक नहीं दिखाई देता है और मुझे संदर्भित 5 या तो स्टैक ओवरफ्लो प्रश्नों में से एक का उल्लेख नहीं मिला है।

डब्ल्यूपी आलेख मुझे बताता है कि, अल्पविराम से सीएसवी और टैब से टीएसवी तक "विस्तार" के माध्यम से, एक्सटेंशन पीएसवी होना चाहिए। हालांकि हर कोई पाइप को एक पाइप नहीं कहता है।

शायद एक लोकप्रिय सॉफ्टवेयर पैकेज है जो पाइप सीमित डेटा का उपयोग करता है और इसके लिए एक विस्तार है, जिससे वास्तविक तथ्य निर्धारित किया जा सकता है?

उत्तर

9

मेरे पास यही प्रश्न था क्योंकि यदि कोई मानक था तो मैं मानक का पालन करना चाहता था। .csv और .tsv की नामकरण प्रणाली पर विचार करते हुए यहां स्पष्ट विकल्प .psv है - हालांकि, मुझे इसे कहीं भी उपयोग में नहीं मिला।

पाइप-सीमांकित फ़ाइल से जुड़े सबसे आम एक्सटेंशन को बस .txt है। Census.gov और अधिकांश अन्य सरकारी इकाइयों के निर्यात पाइप-सीमांकित फ़ाइलों के लिए .txt का उपयोग करते हैं।

+2

मैंने इस पोस्ट में "एचएल 7" का एक अतिरिक्त टैग जोड़ा क्योंकि एचएल 7 डेटा इंटरचेंज प्रारूप आमतौर पर बार का उपयोग करता है। और कैरेट^डेटा को सीमित करने के लिए। इसका विस्तार "एचएल 7" होता है। मैं पाइप सीमित डेटा के लिए सीएसवी या txt का उपयोग करेंगे। पीएसवी किसी के लिए भ्रमित हो सकता है- "अरे, मैं इसे फ़ोटोशॉप वेक्टर के साथ कैसे खोलूं?" लेकिन सीएसवी पढ़ता है कि कोई भी प्रोग्राम शायद समझदारी से एक पाइप में delimiter बदल सकते हैं। धन्यवाद, लीक। –