मैं हडोप मंच पर Web-scale Parallel Inference Engine (WebPIE) तर्ककर्ता का उपयोग करना चाहता हूं। मैंने पहले ही दो उबंटू आभासी मशीनों के साथ हडोप संरचना लागू की है और यह अच्छी तरह से काम कर रहा है। जब मैं आरडीएफ फाइलों पर तर्क करने के लिए वेबपी का उपयोग करना चाहता हूं, तो प्रक्रिया अनुक्रम फ़ाइल प्रारूप की आवश्यकता के कारण विफल हो जाती है। WebPIE tutorial ने हडोप में तर्क के लिए अनुक्रम फ़ाइल प्रारूप के बारे में कुछ भी नहीं बताया। अनुक्रम फ़ाइल स्वरूप उत्पादन करने के लिए मैं निम्नलिखित कोड लिखा है:वितरित सिस्टम में सेमेन्टिक वेब का तर्क
public static void main(String[] args) {
FileInputStream fis = null;
SequenceFile.Writer swriter = null;
try {
Configuration conf = new Configuration();
File outputDirectory = new File("output");
File inputDirectory = new File("input");
File[] files = inputDirectory.listFiles();
for (File inputFile : files) {
//Input
fis = new FileInputStream(inputFile);
byte[] content = new byte[(int) inputFile.length()];
fis.read(content);
Text key = new Text(inputFile.getName());
BytesWritable value = new BytesWritable(content);
//Output
Path outputPath = new Path(outputDirectory.getAbsolutePath()+"/"+inputFile.getName());
FileSystem hdfs = outputPath.getFileSystem(conf);
FSDataOutputStream dos = hdfs.create(outputPath);
swriter = SequenceFile.createWriter(conf, dos, Text.class,
BytesWritable.class, SequenceFile.CompressionType.BLOCK, new DefaultCodec());
swriter.append(key, value);
}
fis.close();
swriter.close();
} catch (IOException e) {
System.out.println(e.getMessage());
}
}
इस कोड को कुछ RDF फाइलों के साथ सही क्रम फ़ाइल प्रारूप का उत्पादन है, लेकिन 100% सही ढंग से काम नहीं करता है, और कभी कभी दूषित फ़ाइलों पैदा करता है। क्या इस कोड से बचने के लिए शुरुआत से कोई समाधान है, और यदि नहीं है, तो मैं इनपुट के रूप में किसी भी आरडीएफ फ़ाइल के साथ सही तरीके से काम करने के लिए इस कोड को कैसे सुधार सकता हूं?
क्या आप जो त्रुटि आ रहे हैं उसके बारे में आप और बता सकते हैं। जैसा कि आप कहते हैं, वेबपीआईई ट्यूटोरियल अनुक्रम फ़ाइलों का उल्लेख नहीं करता है। क्या आप ट्यूटोरियल में वर्णित सब कुछ कर सकते हैं जैसा लिखा है? क्या आप ट्यूटोरियल के साथ किसी भी समस्या में भाग लेते हैं। हैडोप विकी [अनुक्रम फाइल] (http://wiki.apache.org/hadoop/SequenceFile) के बारे में बात करता है, और यह एक उपयोगी संसाधन हो सकता है। –