अब यह एक मुश्किल समस्या है जिसके लिए मैं एक अच्छा समाधान नहीं ढूंढ पा रहा हूं। मान लें कि हमारे पास जावा में एक स्ट्रिंग है: - "उसने आज 3 सेब खाए।" अब अंक 3 को आसानी से जावा में अनन्य फ़ंक्शन का उपयोग करके या नियमित अभिव्यक्तियों का उपयोग करके पहचाना जा सकता है। लेकिन क्या होगा यदि मेरे पास एक स्ट्रिंग है: "उसने आज तीन सेब खाए।" मैं कैसे पहचान सकता हूं कि तीन वास्तव में एक संख्या है? मैंने ओपनएनएलपी का इस्तेमाल किया और अपने पीओएस टैगर का इस्तेमाल किया लेकिन यह करने में जितना समय लगता है वह वास्तव में बहुत अधिक है! क्या कोई इस के लिए बेहतर समाधान सुझा सकता है? OpenNlp के ".bin" के बीच में, एक फ़ाइल- "num.bin" है, लेकिन मुझे नहीं पता कि इस फ़ाइल का उपयोग कैसे करें। ओपनएनएलपी दस्तावेज इसके बारे में कुछ भी नहीं कहता है। क्या कोई मुझे बता सकता है कि यह वही है जो मैं खोज रहा हूं, और यदि हां तो इसका उपयोग कैसे करें।जावा में पाठ प्रसंस्करण
/* ** * ** * ** * ** * ** * ** * ** * ** * * * * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * ** * **/ मैं वास्तव में समय की कमी कर रहा हूँ उसे ई, तो मैं यहाँ एक अस्थायी समाधान पर बस गया है। एक फ़ाइल/शब्दकोश बनाएं और सभी प्रविष्टियों को हैशटेबल में लें। तब मैं आपकी वाक्य को टोकननाइज़ कर दूंगा और शब्दों के लिए शब्द की जांच करूँगा, जैसा कि आपने सुझाव दिया था। जब भी आवश्यक हो मैं फ़ाइल को अपडेट करना जारी रखूंगा। आपके मूल्यवान सुझाव लोगों के लिए धन्यवाद, और यदि आपके पास इससे कुछ बेहतर है तो मैं वास्तव में खुश हूं। ओपनएनएलपी इसे बहुत अच्छे तरीके से लागू करता है, इसके साथ एकमात्र समस्या समय जटिलता है और मैं इसे कम से कम समय में करना चाहता हूं।
क्या आपको केवल संख्याओं का पता लगाने और केवल अंग्रेजी भाषा में ही आवश्यकता है? यदि हां, तो मुझे नहीं लगता कि आपको इसके लिए कुछ लाइब्रेरी चाहिए। मैन्युअल रूप से लिखना बहुत आसान होगा। – bezmax
हां ... केवल संख्या .... लेकिन किसी भी प्रकार की संख्या, दशमलव, अंश, प्रतिशत, 3-1 की तरह फुटबॉल स्कोर का पता लगाया जाना चाहिए ...... केवल अंग्रेजी भाषा के लिए ... –