का उपयोग कर एक निर्देशिका के तहत सभी फ़ाइलों को पुन: संसाधित कैसे कर सकता हूं, मैं फ़ाइलों के बैच को संसाधित करने और कुछ आंकड़े प्राप्त करने के लिए mrjob का उपयोग कर रहा हूं। मैं जानता हूँ कि मैं एक एकल फाइल पर mapreduce काम चला सकते हैं, जैसेमैं mrjob
python count.py <some_input_file> output
लेकिन यह कैसे मैं स्क्रिप्ट के लिए फ़ाइलों की एक निर्देशिका फ़ीड कर सकते हैं? फ़ाइल निर्देशिका संरचना इस folder/subfolders/files
की तरह है, क्या कोई सुझाव है?