क्या किसी को पाठ से दिनांक संदर्भ निकालने का एक सरल, लेकिन प्रभावी तरीका मिला है? मैंने अस्थायी निष्कर्षण उपकरण खोजने के लिए उचित मात्रा में किया है, लेकिन वहां बहुत कुछ नहीं है। कुछ सफेद कागजात हैं, लेकिन ऐसा लगता है कि यह पूरे अर्थात् वेब चीज़ के उप-समूह में पड़ता है लेकिन ज्यादा ध्यान नहीं दिया जाता है।टेम्पोरल एक्सट्रैक्शन (यानी मुक्त फॉर्म टेक्स्ट से दिनांक/समय इकाइयां निकालें) - कैसे?
मैं बस कुछ ऐसा ढूंढ रहा हूं जो 80% प्रभावी है। "जनवरी 200 9 के महीने के बाद" जैसी चीज़ों को पकड़ने की कोई आवश्यकता नहीं है, लेकिन बुनियादी आम तिथियां संस्थाएं अच्छी होंगी।
मैं सभी सुझावों के लिए खुला हूं, यहां तक कि फैंसी रेगेक्स एक्सप्रेशन भी।
आग लगाना!
(और धन्यवाद - हेनरी)
मैं वर्तमान में साल एक सरल regex का उपयोग कर निकालने को पूरा =>/\ ख ((19 | 20) \ घ \ घ) \ b/(केवल झूठी सकारात्मक सीमाओं को सीमित करने के लिए 1 9 और 20 से शुरू होने वाले वर्षों पर ध्यान केंद्रित करना चाहता था); अगला कदम महीनों की तलाश करना है, लेकिन अभी भी एक ही वाक्य में कई तारीखों से निपटने का कोई तरीका नहीं मिला है – henry74