pQuery पर्ल को jQuery जावास्क्रिप्ट ढांचे का एक व्यावहारिक बंदरगाह है जिसका उपयोग स्क्रीन स्क्रैपिंग के लिए किया जा सकता है।मैं थोड़ा विकृत HTML के साथ PQuery काम कैसे कर सकता हूं?
पीआरसी विकृत HTML के लिए काफी संवेदनशील है। निम्न उदाहरण पर विचार करें:
use pQuery;
my $html_malformed = "<html><head><title>foo</title></head><body>bar</body></html>>";
my $page = pQuery($html_malformed);
my $title = $page->find("title");
print "The title is: ", $title->html, "\n";
pQuery डबल ">>
" विकृत HTML में की वजह से ऊपर के उदाहरण में शीर्षक टैग नहीं मिलेगा।
मेरे PQuery आधारित अनुप्रयोगों को विकृत HTML के लिए अधिक सहनशील बनाने के लिए मुझे इसे PQuery पर पास करने से पहले इसे साफ़ करके HTML को पूर्व-प्रोसेस करने की आवश्यकता है।
ऊपर दिए गए कोड खंड से शुरू करना, HTML को साफ करने के लिए सबसे मजबूत शुद्ध-पर्ल तरीका क्या है: इसे PQuery द्वारा सक्षम करें?
क्षमा करें, लेकिन मुझे शुद्ध-पर्ल समाधान की आवश्यकता है। अब इस सवाल में स्पष्ट किया गया है। वैसे भी जवाब के लिए धन्यवाद! :-) – knorv