मेरे पास एक बड़ी टेक्स्ट फ़ाइल है जिसमें कुछ यूनिकोड वर्ण हैं जो लाटेक्स क्रैश करते हैं। मैं गैर-ASCII वर्णों को एक फ़ाइल में sed के साथ कैसे ढूंढ सकता हूं, और लिनक्स बैश की तरह?बैश टूल के साथ गैर-ASCII वर्णों को कैसे खोजें?
grep -P '[^\x00-\x7f]' file
क्या यह बहुमत के साथ यूटीएफ -8 में एक फ़ाइल है अक्षर ASCII हैं, लेकिन कुछ अच्छी तरह से गठित बहु-बाइट यूटीएफ -8 हैं और कुछ टूटा हुआ है (बहु-बाइट) यूटीएफ -8? क्या कई अच्छी तरह से गठित (बहु-बाइट) यूटीएफ -8 वर्ण हैं? या यह पूरी तरह से कुछ अन्य एन्कोडिंग है? –