हाल ही में किए गए वेब एप्लिकेशन में, मैं सुखद आश्चर्यचकित था जब हमारे उपयोगकर्ताओं में से एक ने जापानी में पूरी तरह से कुछ बनाने के लिए इसका उपयोग करने का फैसला किया। हालांकि, पाठ अजीब और अजीब रूप से लपेटा गया था। स्पष्ट रूप से ब्राउज़र जापानी पाठ को बहुत अच्छी तरह से लपेटने का सामना नहीं करते हैं, शायद क्योंकि इसमें कुछ रिक्त स्थान हैं, क्योंकि प्रत्येक वर्ण एक संपूर्ण शब्द बनाता है। हालांकि, यह वास्तव में एक सुरक्षित धारणा नहीं है क्योंकि कुछ शब्द कई पात्रों के बने होते हैं, और कुछ वर्ण समूहों को अलग-अलग पंक्तियों में तोड़ना सुरक्षित नहीं है।जापानी के लिए वर्ड रैप एल्गोरिदम
चारों ओर गुगल करने से वास्तव में समस्या को समझने में मेरी मदद नहीं हुई है। ऐसा लगता है कि किसी को अटूट पैटर्न के शब्दकोश की आवश्यकता होगी, और मान लें कि हर जगह तोड़ने के लिए सुरक्षित है। लेकिन मुझे डर है कि मैं जापानी शब्दों के बारे में पूरी तरह से नहीं जानता कि वास्तव में उन सभी शब्दों को जान सकूं, जिन्हें मैं अपनी कुछ खोजों से समझता हूं, काफी जटिल हैं।
आप इस समस्या से कैसे संपर्क करेंगे? क्या कोई पुस्तकालय या एल्गोरिदम हैं जो आप जानते हैं कि पहले से मौजूद हैं जो इस संतोषजनक तरीके से निपटते हैं?
सटीक डुप्लिकेट http://stackoverflow.com/questions/1605353/how-does-one-word-break-languages-without-spaces-between-words-like-asian-langua – Breton
मुझे लगता है कि आप शब्द नहीं कर सकते जापानी शब्दों को समझने के बिना लपेटें ताकि आपको कम से कम एक जापानी शब्दकोश की आवश्यकता हो। मैं आपको यह नहीं बता सका कि कितना मुश्किल होगा या यदि कोई अस्पष्टता होगी (जिसका अर्थ है कि सही शब्द संदर्भ पर निर्भर करता है, जो इसे जटिल बना देगा)। – cletus
वास्तव में डुप्लिकेट नहीं है - यह प्रश्न इंडेक्सिंग के उद्देश्य के लिए शब्दों में पाठ को तोड़ने के बारे में है। यह एक कठिन समस्या है। सौभाग्य से, लेआउट के लिए लपेटते समय इसे बड़े पैमाने पर अनदेखा किया जा सकता है। –