मेरे पास utf8 एन्कोडिंग के साथ एक एक्सएमएल है। और इस फ़ाइल में बीओएम फ़ाइल की शुरुआत है। तो पार्सिंग के दौरान मुझे org.xml.sax.SAXParseException के साथ सामना करना पड़ रहा है: प्रोलॉग में सामग्री की अनुमति नहीं है। मैं फ़ाइलों से उन 3 बाइट्स को हटा नहीं सकता। मैं फ़ाइल को स्मृति में लोड नहीं कर सकता और उन्हें यहां हटा सकता हूं (फ़ाइलें बड़ी हैं)। तो प्रदर्शन कारणों से मैं SAX पार्सर का उपयोग कर रहा हूं और अगर वे टैग से पहले मौजूद हैं तो बस उन 3 बाइट्स को छोड़ना चाहते हैं। क्या मुझे इसके लिए इनपुटस्ट्रीम रीडर का उत्तराधिकारी होना चाहिए?क्यों org.apache.xerces.parsers.SAXParser utf8 एन्कोडेड xml में BOM को नहीं छोड़ता है?
मैं जावा में नया हूं - कृपया मुझे सही तरीका दिखाएं।
[बाइट क्रम चिह्न शिकंजा के संभावित डुप्लिकेट अप फ़ाइल पढ़ने जावा में] (http://stackoverflow.com/questions/1835430/byte-order-mark-screws-up-file-reading-in-java) –