मुझे रेल ऐप में Elasticsearch (और टायर) के साथ काम करने के लिए हाइलाइटिंग प्राप्त करने में समस्या हो रही है। मैं पीडीएफ अनुलग्नकों को सफलतापूर्वक अनुक्रमित कर सकता हूं और उनसे पूछताछ कर सकता हूं लेकिन मुझे काम करने के लिए हाइलाइटिंग नहीं मिल सकती है।लोचदार खोज: अनुलग्नक के भीतर से हिट को हाइलाइट करना
ईएस से परिचित नहीं है, इसलिए यह सुनिश्चित न करें कि समस्या निवारण कहां देखना है। मैपिंग और एक कर्ल क्वेरी के साथ शुरू होगा लेकिन अधिक जानकारी के लिए पूछने के लिए स्वतंत्र महसूस करें।
$ curl -XGET 'http://localhost:9200/_mapping?pretty=true'
{
"articles" : {
"article" : {
"properties" : {
"attachment" : {
"type" : "attachment",
"path" : "full",
"fields" : {
"attachment" : {
"type" : "string"
},
"title" : {
"type" : "string",
"store" : "yes"
},
"name" : {
"type" : "string",
"store" : "yes"
},
"date" : {
"type" : "date",
"ignore_malformed" : false,
"store" : "yes",
"format" : "dateOptionalTime"
},
"content_type" : {
"type" : "string"
}
}
},
"content" : {
"type" : "string"
},
"created_at" : {
"type" : "date",
"ignore_malformed" : false,
"format" : "dateOptionalTime"
},
"filename" : {
"type" : "string"
},
"id" : {
"type" : "integer",
"ignore_malformed" : false
},
"published_on" : {
"type" : "date",
"ignore_malformed" : false,
"format" : "dateOptionalTime"
},
"title" : {
"type" : "string"
},
"updated_at" : {
"type" : "date",
"ignore_malformed" : false,
"format" : "dateOptionalTime"
}
}
}
}
}%
एक एक 125 पेज अनुक्रमित पीडीएफ के अंदर 'हिट' की एक जिज्ञासा:
:$ curl "localhost:9200/_search?pretty=true" -d '{
quote> "fields" : ["title"],
quote> "query" : {
quote> "query_string" : {
quote> "query" : "xerox"
quote> }
quote> },
quote> "highlight" : {
quote> "fields" : {
quote> "attachment" : {}
quote> }
quote> }
quote> }'
{
"took" : 1077,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 0.036417194,
"hits" : [ {
"_index" : "articles",
"_type" : "article",
"_id" : "13",
"_score" : 0.036417194,
"fields" : {
"title" : "F-E12"
}
} ]
}
}%
मैं की तरह एक अनुभाग उम्मीद कर रहा था (कर्ल के माध्यम से)
class Article < ActiveRecord::Base
include Tire::Model::Search
include Tire::Model::Callbacks
attr_accessible :title, :content, :published_on, :filename
mapping do
indexes :id, :type =>'integer'
indexes :title
indexes :content
indexes :published_on, :type => 'date'
indexes :attachment, :type => 'attachment',
:fields => {
:name => { :store => 'yes' },
:content => { :store => 'yes' },
:title => { :store => 'yes' },
:file => { :term_vector => 'with_positions_offsets', :store => 'yes' },
:date => { :store => 'yes' }
}
end
def to_indexed_json
to_json(:methods => [:attachment])
end
def attachment
if filename.present?
path_to_pdf = "/Volumes/Calvin/sample_pdfs/#{filename}.pdf"
Base64.encode64(open(path_to_pdf) { |pdf| pdf.read })
else
Base64.encode64("missing")
end
end
end
मैपिंग
"highlight" : {
"attachment" : [ "\nLast Year <em>Xerox</em> moved their facilities" ]
}
किसी भी मदद के लिए धन्यवाद!
EDIT2: समायोजित क्वेरी (attachment.file
को attachment
परिवर्तित) कोई लाभ नहीं हुआ:
$ curl "localhost:9200/_search?pretty=true" -d '{
"fields" : ["title","attachment"],
"query" : {"query_string" : {"query" : "xerox"}},
"highlight" : {"fields" : {"attachment.file" : {}}}
}'
{
"took" : 221,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 0.036417194,
"hits" : [ {
"_index" : "articles",
"_type" : "article",
"_id" : "13",
"_score" : 0.036417194,
"fields" : {
"title" : "F-E12",
"attachment" : "JVBERi0xLjYNJeLjz9MNCjk4NSAwIG9iag08PC9MaW5lYXJpemVkIDEvTCA...\n"
}
} ]
}
}
Edit3 ("फील्ड" निकालने के लिए):
$ curl "localhost:9200/_search?pretty=true" -d '{
> "query" : {"query_string" : {"query" : "xerox"}},
> "highlight" : {"fields" : {"attachment" : {}}}
> }'
{
"took" : 1078,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 0.036417194,
"hits" : [ {
"_index" : "articles",
"_type" : "article",
"_id" : "13",
"_score" : 0.036417194, "_source" : {"content":"Real report","created_at":"2012-08-28T22:44:08Z","filename":"F-E12","id":13,"published_on":"2007-12-28","title":"F-E12","updated_at":"2012-08-28T22:44:08Z","attachment":"JVBERi0xLjYNJeLjz9MNCjk4NSAwIG9iag08PC9MaW5lYXJpemVkID...\n"
}
} ]
}
}
Edit4 (कार्रवाई में अनुलग्नक प्रकार से मानचित्रण ट्यूटोरियल):
$ curl -XGET 'http://localhost:9200/test/_mapping?pretty=true'
{
"test" : {
"attachment" : {
"properties" : {
"file" : {
"type" : "attachment",
"path" : "full",
"fields" : {
"file" : { #<== This appears to be missing
"type" : "string", #<== from my Articles mapping
"store" : "yes", #<==
"term_vector" : "with_positions_offsets" #<==
},
"author" : {
"type" : "string"
},
"title" : {
"type" : "string",
"store" : "yes"
},
"name" : {
"type" : "string"
},
"date" : {
"type" : "date",
"ignore_malformed" : false,
"format" : "dateOptionalTime"
},
"keywords" : {
"type" : "string"
},
"content_type" : {
"type" : "string"
}
}
}
}
}
}
}
मुझे डर है कि आपके द्वारा पोस्ट किया गया मैपिंग एक अलग प्रकार से संबंधित है: यह अनुलग्नक है, लेख नहीं। क्या आप वाकई लेख मैपिंग सही हैं? क्या आप आउटपुट में फ़ील्ड अटैचमेंट भी जोड़ सकते हैं? – javanna
मुझे यकीन नहीं है * कुछ भी * सही है इसलिए कृपया सुझाव दें। मैंने आपके द्वारा पूछे गए 'अनुलग्नक' विधि को जोड़ा है। आपकी सहायता की सराहना! – Meltemi
क्षमा करें, मैंने नहीं देखा कि आप अनुलग्नक फ़ील्ड प्रकार का उपयोग कर रहे थे! मैपिंग अच्छा लग रहा है! मुझे लगता है कि आपको 'अटैचमेंट' के बजाय 'attachment.file' फ़ील्ड को हाइलाइट करने का प्रयास करना चाहिए। मुझे बताएं कि यह कैसे चला गया! – javanna