नच

2012-11-17 37 views
8

द्वारा क्रॉल किए गए सोलर डेटा में अनुक्रमण करते समय त्रुटि मैंने नच और सोलर के साथ काम करना शुरू कर दिया है और मुझे नच के साथ सोलर को एकीकृत करने में समस्या है। http://wiki.apache.org/nutch/NutchTutorial और बाद का उपयोग कर: bin/nutch crawl urls -solr http://localhost:8983/solr/ -depth 3 -topN 5 Nutch से पता चलता संदेश:नच

java.io.IOException: Job failed!

और Solr दिखा रहा है:

SEVERE: org.apache.solr.common.SolrException: ERROR: [doc=http://nutch.apache.org/] unknown field 'host'

मैंने सोचा था कि कारण में एक लापता 'होस्ट' फ़ील्ड हो सकता है मैं इस ट्यूटोरियल का पालन किया $ SOLR_HOME/उदाहरण/solr/conf/schema.xml लेकिन यह वहां है। मैं आपकी मदद के लिए बहुत आभारी हूं।

+3

क्या आपने नच स्कीमा को एसओएलआर में कॉपी किया था? सीपी $ {NUTCH_RUNTIME_HOME} /conf/schema.xml $ {APACHE_SOLR_HOME}/उदाहरण/solr/conf/ –

+0

हाँ, मैंने इसकी प्रतिलिपि बनाई है। – user1831647

+2

जांचें कि क्या स्कीमा में मेजबान परिभाषित किया गया है। सौर बंद करो। डेटा निर्देशिका हटाएं। सौर शुरू करो। पुनः प्रयास करें। –

उत्तर

2

नच पक्ष में कॉन्फ़िगरेशन कॉन्फ़िगरेशन सौर की स्कीमा को प्रभावित नहीं करता है। आपको उस क्षेत्र को Solma के schema.xml पर परिभाषित करना होगा।