सोलर (3.3) में सटीक वाक्यांश क्वेरी, क्या EdgeNGramFilterFactory
के माध्यम से एक फ़ील्ड लेटर-बाय-लेटर खोजने योग्य है और वाक्यांश क्वेरी के प्रति संवेदनशील भी है?सोलर: एक EdgeNGramFilterFactory
उदाहरण से, मैं एक क्षेत्र है कि, अगर "Contrat informatique" युक्त, मिल जाएगा के लिए देख रहा हूँ, तो उपयोगकर्ता प्रकार:
- Contrat
- informatique
- contr
- सूचना
- "Contrat informatique"
- "Contrat जानकारी"
वर्तमान में, मैं कुछ इस तरह बनाया:
<fieldtype name="terms" class="solr.TextField">
<analyzer type="index">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<tokenizer class="solr.LowerCaseTokenizerFactory"/>
<filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" side="front"/>
</analyzer>
<analyzer type="query">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
<tokenizer class="solr.LowerCaseTokenizerFactory"/>
</analyzer>
</fieldtype>
... लेकिन यह वाक्यांश प्रश्नों पर असफल रहा।
जब मैं Solr व्यवस्थापक में स्कीमा विश्लेषक में लग रहे हैं, मुझे लगता है कि "Contrat informatique" निम्न टोकन उत्पन्न:
[...] contr contra contrat in inf info infor inform [...]
तो क्वेरी (लगातार टोकन) "में Contrat" के साथ काम करता है, लेकिन नहीं "contrat inf" (क्योंकि यह दो टोकन अलग हैं)।
मुझे यकीन है कि किसी भी तरह का स्टेमिंग वाक्यांश प्रश्नों के साथ काम कर सकता है, लेकिन मुझे EdgeNGramFilterFactory
से पहले उपयोग करने के लिए फ़िल्टर का सही टोकननाइज़र नहीं मिल रहा है।
हाय, जेवियर। क्या आप कृपया बता सकते हैं कि आपने "cont info" को + cont + info में कैसे बदल दिया है, इसके लिए बॉक्स उपयोग कक्षा में से कोई भी जानकारी है? या यह सिर्फ दोहरे उद्धरणों की पहचान करता है और मैन्युअल रूप से बदल जाता है? मैं इसे हल करने की कोशिश कर रहा हूं: http: // stackoverflow।कॉम/प्रश्न/37033381/सोलर-सर्च-फील्ड-बेस्ट प्रैक्टिस – wattale
यह मैन्युअल ऑपरेशन था, जो डबल कोटेशन की तलाश में था और प्लस साइन जोड़ रहा था। मुझे ऐसा कुछ भी नहीं मिला जो मेरे लिए इसे स्वचालित कर सके: -/ –
उत्तर xavier के लिए धन्यवाद, मेरे लिए इतनी सारी सामग्री को क्रॉल करने के बाद भी बॉक्स समाधान से बाहर नहीं मिला। मैंने सोचा कि मैं इसे मैन्युअल रूप से कर कर पहिया को फिर से शुरू कर रहा हूं। लेकिन मुझे लगता है कि इसे मैन्युअल रूप से करने का एकमात्र विकल्प उपलब्ध है: | – wattale