मैंने स्टैक ओवरफ्लो पर अन्य प्रश्नों के माध्यम से पढ़ा है, लेकिन अभी भी कोई करीब नहीं है। क्षमा करें, अगर इसका पहले से ही उत्तर दिया गया है, लेकिन मुझे काम करने के लिए प्रस्तावित कुछ भी नहीं मिला।पाइथन नियमित अभिव्यक्तियों में यूनिकोड वर्णों से मिलान
>>> import re
>>> m = re.match(r'^/by_tag/(?P<tag>\w+)/(?P<filename>(\w|[.,!#%{}()@])+)$', '/by_tag/xmas/xmas1.jpg')
>>> print m.groupdict()
{'tag': 'xmas', 'filename': 'xmas1.jpg'}
सब कुछ ठीक है, तो मैं में नार्वे पात्रों के साथ कुछ कोशिश यह (या कुछ और अधिक यूनिकोड की तरह):
>>> m = re.match(r'^/by_tag/(?P<tag>\w+)/(?P<filename>(\w|[.,!#%{}()@])+)$', '/by_tag/påske/øyfjell.jpg')
>>> print m.groupdict()
Traceback (most recent call last):
File "<interactive input>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'groupdict'
मैं ठेठ यूनिकोड वर्ण कैसे मिलान कर सकते हैं, øæå की तरह? मैं उपरोक्त टैग-समूह और फ़ाइल नाम के लिए दोनों पात्रों से मिलान करने में सक्षम होना चाहता हूं।
सुनिश्चित करें कि आप [सामान्य] (https करें: //docs.python.org/2/library/unicodedata.html#unicodedata.normalize) अपने स्ट्रिंग्स क्योंकि एक ही दृश्य अनुकूलता उत्पन्न करने वाले भिन्न कोडपॉइंट-अनुक्रम होते हैं। – janbrohl