2010-12-07 7 views
6

मैं PHP कक्षा लिख ​​रहा हूं जिसे HTML स्रोत से सभी potentially dangerous elements or bogus html tag (such as bad links) को निकालना है।एचटीएमएल शुद्धीकरण php

आमतौर पर मैं HTML Purifier library या इसी तरह के पुस्तकालय,
का प्रयोग करेंगे लेकिन स्वयं लिखा कोड इस परियोजना में आवश्यक है।

दो शर्तें हैं:

  1. यह 3KB कोड की तुलना में अधिक नहीं हो सकता
  2. यह वास्तव में तेजी से

मैं कुछ है कि काम कर सकता है लिखा था पर अमल करना चाहिए: http://pihost.pl/purify.php
लेकिन मुझे नहीं पता कि यह

मेरा प्रश्न पूछने के लिए पर्याप्त सुरक्षित है या नहीं:
क्या इसका परीक्षण करने का कोई तरीका है?
या शायद किसी के पास इस तरह की त्वरित, छोटी और परीक्षण लाइब्रेरी है?

+1

'संभावित खतरनाक तत्वों' से आपका क्या मतलब है? – Ben

+0

जावास्क्रिप्ट, फ्लैश और जावा तत्व, "खराब लिंक" – Ascon

+1

सुरक्षा मेम: * अवांछित * विशेषताओं (ऑनक्लिक =) को फ़िल्टर करने की सलाह दी जाती है, लेकिन * दुर्भावनापूर्ण * सामग्री (img src = जावास्क्रिप्ट) पर एक त्रुटि संदेश के साथ बस जमानत है। मालकिन को साफ करने की कोशिश मत करो, बस इसे छोड़ दें। – mario

उत्तर

1

विचार करने के लिए एक महत्वपूर्ण बात - आपके शोधक टूटा/विकृत HTML पर प्रतिक्रिया कैसे करता है? उस स्थिति का मुकाबला करने के लिए, मैं आपको इसे शुद्ध करने से पहले एचटीएमएल को साफ करने के लिए पहले PHP tidy के माध्यम से इसे चलाने का सुझाव दूंगा।

यदि आप परीक्षणों की एक श्रृंखला चाहते हैं, तो आप tests को जांचने का प्रयास कर सकते हैं जो HTMLPurifier उपयोग करता है। http://ha.ckers.org/xss.html

आप अपने शुद्ध के माध्यम से उन चलाने की कोशिश कर सकता है और देखते हैं कि बाहर दूसरी तरफ आता है:

0

इस साइट में उदाहरण के कारनामे की एक टन है।