2012-10-11 11 views
8

मैं मोबाइल फोन से ली गई तस्वीरों को संसाधित करने के लिए ओपनसीवी का उपयोग कर रहा हूं। चित्रों में टेक्स्ट होता है, और उनके पास गति धुंध की थोड़ी मात्रा होती है, जिसे मुझे हटाने की आवश्यकता होती है।कौन सा deconvolution एल्गोरिदम पाठ से गति धुंध को हटाने के लिए सबसे उपयुक्त है?

उपयोग करने के लिए सबसे व्यवहार्य एल्गोरिदम क्या होगा? मैंने अब तक लुसी-रिचर्डसन और वीनर deconvolution का परीक्षण किया है, लेकिन वे संतोषजनक परिणाम नहीं मिला।

उत्तर

4

मोशन ब्लर को दूर करने में एक मुश्किल समस्या है। सबसे अच्छा परिणाम प्राप्त कर रहे हैं जब

  1. दृश्य के लिए कैमरे रिश्तेदार की गति में जाना जाता है
  2. आप धुंधले वस्तु जो आप सहसंबंधी कर सकते हैं के कई चित्रों की है।

आपको लगता है कि आप पाठ को देख रहे हैं (जो आम तौर उच्च विपरीत सुविधाओं का गठन किया) में एक प्रमुख लाभ है। यदि आप केवल उच्च विपरीत के लिए deconvolution लागू करते हैं (मुझे पता है कि सिद्धांत अक्सर उच्च विपरीत को बाहर करने के लिए है) अपनी छवि के क्षेत्रों में आपको परिणाम मिलना चाहिए जो आपको पात्रों को बेहतर ढंग से पहचानने में सक्षम हो सकते हैं। प्री/पोस्ट प्रोसेसिंग को तेज करने/धुंधला फ़िल्टरों का संयोजन भी मदद कर सकता है।

मुझे पहले this paper से प्रभावित होने की याद आ रही है। शायद उनके कार्यान्वयन पर एक अनुकूलन एक लायक होगा।

0

आप गति धुंध को खत्म नहीं कर सकते हैं। जानकारी हमेशा के लिए खो जाती है। आप जो काम कर रहे हैं वह एक सीसीडी है जो एक ही पिक्सेल में कई वास्तविक वस्तुओं को रिकॉर्ड कर रही है, उन्हें एक साथ धुंधला कर रही है। दूसरे शब्दों में यदि पिक्सेल 56 पढ़ता है, तो आप जादुई रूप से निर्धारित नहीं कर सकते कि वास्तविक पठन समय 1 पर 37 और समय पर 43 और 43 समय पर 43 होना चाहिए।

इसे देखने का एक और तरीका: कल्पना करें 5 तस्वीरें हैं फिर आप फ़ोटोशॉप का उपयोग चित्रों को एक साथ मिश्रित करने के लिए करते हैं, प्रत्येक पिक्सेल के मूल्य का औसत। क्या आप अब मिश्रित तस्वीर से किसी भी तरह बता सकते हैं कि मूल 5 चित्र क्या थे? नहीं, आप नहीं कर सकते, क्योंकि आपके पास ऐसा करने की जानकारी नहीं है।

+7

सत्य नहीं है, यदि आप बिंदु-प्रसार फ़ंक्शन (पीएसएफ) का अनुमान लगा सकते हैं तो आप छवि को बढ़ाने के लिए एक deconvolution एल्गोरिदम (शीर्षक में ओपी राज्यों के रूप में) लागू कर सकते हैं। – TheJuice

+0

मुझे लगता है कि यह "वृद्धि" की आपकी परिभाषा पर निर्भर करता है। एक व्यावहारिक मामले के रूप में, आप किसी भी छवि को किसी भी तरह से डिब्लर नहीं कर सकते हैं कि एक सामान्य व्यक्ति एक महत्वपूर्ण सुधार के रूप में माना जाएगा। Deconvolution केवल एक व्यावहारिक दृष्टिकोण से प्रासंगिक है जब आपके पास ज्ञात संकेत परिवर्तन होता है। एक मोशन ब्लर एक बेहद अराजक कार्य है जिसे आप कुछ प्रदूषित प्रयोगशाला उदाहरण को छोड़कर, किसी भी प्रकार की उपयोगिता को निर्धारित करने में सक्षम नहीं होंगे। –

+1

वास्तविक दुनिया की एक सामान्य डिजिटल छवि में बहुत सी अनावश्यकता है, यही कारण है कि आप कई परिवर्तनों से पुनर्प्राप्त कर सकते हैं जिसका मतलब है कि अधिकतम एंटरप्राइज़ वाली छवियों पर लागू होने पर अपरिवर्तनीय सूचना हानि होगी। – enobayram

1

मुझे लगता है कि आपके पॉइंट-फैल फ़ंक्शन का आकलन एल्गोरिदम का उपयोग करने से अधिक महत्वपूर्ण होने की संभावना है। यह उस गति धुंध के प्रकार पर निर्भर करता है जिसे आप निकालने का प्रयास कर रहे हैं, रैखिक गति सबसे आसान होने की संभावना है, लेकिन जिस तरह से आप निकालने का प्रयास कर रहे हैं, उसकी संभावना नहीं है: मुझे लगता है कि यह एक्सपोजर के दौरान हाथ आंदोलन के कारण गैर-रैखिक है ।

+0

हां, यह गैर-रैखिक है। जब लोग कैमरा बटन दबाते हैं, तो उनका हाथ अभ्यास में कैमरे को तेज करता है। तो निश्चित रूप से एक गैर रेखीय घटक है। – sashoalm

6

@TheJuice के साथ सहमत हैं, आपकी समस्या पीएसएफ अनुमान में निहित है। आम तौर पर एक फ्रेम से ऐसा करने में सक्षम होने के लिए, धुंध की ओर अग्रसर कारकों (ऑब्जेक्ट की गति, सेंसर की गति के प्रकार इत्यादि) के बारे में कई धारणाएं करने की आवश्यकता होती है।

आप कुछ पॉइंटर्स पा सकते हैं, खासकर मोनोडिमेन्शनल केस, here पर। वे एक फ़िल्टरिंग विधि का उपयोग करते हैं जो धुंध से ज्यादातर सहसंबंध छोड़ देता है, मूल छवि के स्थानिक सहसंबंध को छोड़ देता है, और इसका उपयोग गति दिशा को कम करने और पीएसएफ से निकालने के लिए करता है। छोटे ब्लर्स के लिए आप गति को निरंतर मानने में सक्षम हो सकते हैं; अन्यथा आपको एक अधिक जटिल त्वरित गति मॉडल का उपयोग करना होगा।

दुर्भाग्यवश, मोबाइल फोन धुंध अक्सर सीसीडी एकीकरण और गैर-रैखिक गति (दृष्टि की रेखा के लंबवत अनुवाद, कलाई गति से यो, और कलाई के चारों ओर घूर्णन) का एक चक्र है, इसलिए यित्झाकी और कोपेका की विधि शायद केवल उपज होगी मामूली मामलों में स्वीकार्य परिणाम। मुझे पता है कि उस ("गहराई से जागरूकता" और अन्य) से निपटने के तरीके हैं लेकिन मुझे कभी उनके साथ व्यवहार करने का अवसर नहीं मिला है।

आप फ़ोकस मैजिक जैसे फोटो रिकवरी सॉफ़्टवेयर का उपयोग करके परिणामों का पूर्वावलोकन कर सकते हैं; जबकि वे वाईके अनुमानक को नियोजित नहीं करते हैं (गति विवरण आपको छोड़ दिया जाता है), शेष वर्कफ़्लो आवश्यक रूप से बहुत समान है। यदि आपकी तस्वीरें फोकस मैजिक रिकवरी के लिए उपयुक्त हैं, तो शायद वाईके विधि काम करेगी। यदि वे नहीं हैं (या पर्याप्त नहीं हैं, या उनमें से पर्याप्त नहीं हैं), तो इसे लागू करने की कोशिश करने का कोई मुद्दा नहीं है।

+0

मैंने फोकस मैजिक [मेरे परीक्षण नमूने में से एक] पर प्रयास किया (http://i.imgur.com/6Txyq.png), और [यह आउटपुट] है (http://i.imgur.com/No1s0.png)। मैंने पैरामीटर चरण 6 और 70 डिग्री के लिए उपयोग किया, लेकिन आउटपुट वास्तव में थोड़ा खराब लगता है। क्या आपको लगता है कि वाईके उससे बेहतर कर सकता है? – sashoalm