2011-02-03 16 views
9

मुझे रीयल-टाइम में आईफोन पर कैमरा छवि से संख्याओं को पहचानने की आवश्यकता है। मुझे पता है कि छवि पर 5 से अधिक अंक नहीं होंगे।वास्तविक समय में आईफोन पर संख्या पहचान संभव है?

क्या यह समस्या आईफोन के कम्प्यूटेशनल विनिर्देशों को हल करने के लिए यथार्थवादी है? क्या किसी को टेस्सेक्टैक्ट ओसीआर लाइब्रेरी का उपयोग करके कोई अनुभव है, और क्या आपको लगता है कि इसका उपयोग करके इसे हल किया जा सकता है?

+0

संभव डुप्लिकेट: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@Daniel: यह सवाल पूछता है कैसे करने के लिए एक ओर जहां किसी भी छवि में संख्याओं को पढ़ने के लिए टेस्सेक्ट का उपयोग करें, यह लाइव वीडियो स्ट्रीम से इस प्रकार की प्रसंस्करण करने की संभावना की जांच कर रहा है। मेरा मानना ​​है कि एक नए प्रश्न को न्यायसंगत बनाने के लिए यहां काफी अंतर है। –

उत्तर

1

यह कम्प्यूटेशनल रूप से संभव होना चाहिए। ऐसे ऐप्स हैं जो वास्तविक समय में बार कोड प्राप्त कर सकते हैं और एक ऐप भी जो वास्तविक समय अनुवाद करता है। (वर्ड लेंस)। मुझे यकीन नहीं है कि वे किस पुस्तकालय का उपयोग करते हैं, हालांकि।

11

"वास्तविक समय" की आपकी परिभाषा पर निर्भर करता है, लेकिन हां, आईफोन 4 पर अंकों 0-9 के अपेक्षाकृत तेज़ मान्यता करना संभव है, खासकर यदि आप फोंट, प्रकाश की स्थिति आदि कर सकते हैं। । वे

मैं अत्यधिक आईफोन कैमरा का उपयोग कर how Sudoku Grab does its recognition of puzzles पर आलेख पढ़ने की सलाह देता हूं। उनके मामले में, अंकों की पहचान करने के लिए एक प्रशिक्षित तंत्रिका नेटवर्क का उपयोग किया गया था, जो आधुनिक आईओएस हार्डवेयर पर उचित रूप से सरल और तेज़ होना चाहिए।

ओपनसीवी की तरह मौजूदा मान्यता पुस्तकालय, आईफोन के सीपीयू का प्रसंस्करण करने के लिए उपयोग करेंगे। मैंने सुना है कि वे कम से कम जटिल कार्य कर सकते हैं जैसे कि चेहरे की पहचान तेजी से वीडियो स्रोतों के साथ उपयोग करने के लिए पर्याप्त है, जबकि कम से कम स्टटर दिखाते हैं।

बेहतर प्रदर्शन के लिए, मुझे विश्वास है कि नए आईओएस उपकरणों पर प्रोग्राम करने योग्य जीपीयू में बहुत संभावनाएं हैं। my benchmarks में, मैंने सरल छवि प्रसंस्करण के लिए आईफोन 4 के जीपीयू का उपयोग करते समय 14X - 28X स्पीडअप देखा। जबकि कुछ लोग अभी इस पर देख रहे हैं, सुडोकू ग्रैब के तंत्रिका नेटवर्क जैसे कुछ जीपीयू पर चलने से लाभ उठाने के लिए एक समानांतर प्रक्रिया होनी चाहिए।

+0

उपयोगी काम http://www.benjaminloulier.com – iCoder86

0

हां। Bender इसके साथ आपकी मदद कर सकता है। यह आपको आईओएस पर तंत्रिका जाल बनाने और चलाने देता है। चूंकि यह हुड के नीचे धातु का उपयोग करता है, यह तेज़ और चिकनी चलता है। यह सीधे टेंसरफ्लो मॉडल को चलाने का भी समर्थन करता है।

तो तुम Bender में TensorFlow में एक मौजूदा मॉडल अंकों मान्यता Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras के लिए प्रशिक्षित किया है, तो आप मदद

अस्वीकरण जरूरत चला सकते हैं: मैं इस परियोजना पर काम किया।

0

इसके लिए मुफ्त एसडीके है: http://rtrsdk.com/ वास्तविक समय में काम करता है, आईओएस और एंडोरिड दोनों का समर्थन करता है, आपको किसी भी पाठ को कैप्चर करने में मदद करता है, संख्याएं कोई समस्या नहीं होनी चाहिए।

अस्वीकरण: मैं ABBYY के लिए काम

की