मेरे पास माइक्रोसॉफ्ट वर्ड से उत्पन्न एचटीएमएल प्रारूप में काफी बड़ा दस्तावेज़ है। यह बहुत गड़बड़ है और फुले हुए चीजों से भरा हुआ है (जैसे अनजान टैग, अनकॉर्न नेमस्पेस इत्यादि और अन्य ब्लोटेड चीजें)माइक्रोसॉफ्ट एचटीएमएल दस्तावेज़ को कैसे साफ करें?
क्या इसे सादे एचटीएमएल सिटैक्स में परिवर्तित करने का कोई तरीका है?