2009-06-12 11 views
11

मेरे पास डब्ल्यूएवी प्रारूप (सभी अलग-अलग उपकरणों और पिचों) में विभिन्न ऑडियो रिकॉर्डिंग का एक गुच्छा है, और मैं उन्हें "सामान्य" करना चाहता हूं ताकि वे सभी खेला जाने पर लगभग समान मात्रा में आवाज उठा सकें।मैं कैसे निर्धारित कर सकता हूं कि डब्ल्यूएवी फ़ाइल कितनी जोरदार होगी?

मैंने औसत नमूना परिमाण (नमूने की संख्या से विभाजित सभी पूर्ण मूल्यों का योग) मापने की कोशिश की है, लेकिन इस माप से सामान्यीकरण बहुत अच्छी तरह से काम नहीं करता है। मुझे लगता है कि यह विधि काम नहीं कर रही है क्योंकि यह ध्वनियों की आवृत्ति को ध्यान में रखती नहीं है, और मुझे पता है कि उच्च आवृत्ति रिकॉर्डिंग समान आयाम की निम्न-आवृत्ति ध्वनियों की तुलना में अधिक जोर से आवाज उठाती है।

क्या किसी को ध्वनि की जोर को मापने के लिए एक अच्छी विधि पता है?

+0

ऐसा लगता है कि यह आपके नियंत्रण के बाहर कई कारकों पर निर्भर है - इनमें से सबसे बड़ी श्रोता की विभिन्न आवृत्तियों की सापेक्ष संवेदनशीलता है। यह व्यक्ति से अगले तक थोड़ा अलग होता है। –

+2

एह? वह क्या है? – MusiGenesis

+0

बस मजाक कर रहे हैं। हाँ, इसमें से बहुत से व्यक्ति अलग-अलग होंगे, लेकिन मैं आम तौर पर यथासंभव सामान्य बनाना चाहता हूं। – MusiGenesis

उत्तर

10

Root Mean Square अक्सर ध्वनि फ़ाइलों की जोर से अनुमान लगाने के लिए उपयोग किया जाता है। ऐसा इसलिए है क्योंकि एक आवाज जो बहुत ज़ोरदार हो, उसे इस तरह से नहीं माना जा सकता है अगर यह बहुत छोटा है। यह भी याद रखें कि आयाम के वर्ग के साथ बिजली तेजी से बढ़ जाती है।

हाइड्रोजन ऑडियो पर ऑडियो गीक्स इस सामग्री के बारे में एक टन जानते हैं ... उनके मुफ्तReplay Gain सॉफ़्टवेयर देखें। आपको किसी भी प्रोग्रामिंग को करने की आवश्यकता नहीं हो सकती है।

संपादित करें: शक्ति बनाम आयाम पर टिप्पणी प्रतिक्रिया शामिल है।

+0

एक आकर्षण की तरह काम किया, धन्यवाद। मेरी स्नातक की डिग्री भौतिकी में थी, इसलिए मैं शर्मिंदा हूं कि मुझे यह याद नहीं आया। मैंने एन नमूनों को गुणा करने और एनएच रूट लेने से पहले वास्तव में कुछ बेवकूफ किया था, यह सोचकर कि रूट का मतलब वर्ग क्या था। मुझे खुद से बचाने के लिए धन्यवाद। – MusiGenesis

+1

आप इस तथ्य पर ध्यान देना चाहेंगे कि सभी आवृत्तियों को श्रोता द्वारा समान नहीं किया जाता है। बहुत कम आवृत्तियों का एक निश्चित आरएमएस स्तर उच्च आवृत्तियों के समान आरएमएस स्तर की तुलना में बहुत अधिक ध्वनि के रूप में माना जा सकता है। – sthg

+3

लाउडनेस धारणा वास्तव में आवृत्ति निर्भर है, और समान जोरदारता (http://en.wikipedia.org/wiki/Loudness) का पालन करती है। –

3

अच्छी तरह से ऑडियो पर एक विशेषज्ञ नहीं होने और पिछली टिप्पणी में जोड़ने के लिए, आपको यह समझना चाहिए कि आप "पीक पावर के लिए सबसे कम समय" के रूप में परिभाषित करते हैं और फिर लहर को कच्चे फ्लोटिंग पॉइंट में परिवर्तित करें और आरएमएस का उपयोग करें समय की खिंचाव और लगातार उस समय के भाग लेते हैं, MAX खोजें और वहां आपकी सर्वोच्च चोटी शक्ति है।

-1

मैं यहां से रास्ता निकाल सकता हूं, लेकिन, यदि आपके पास वेवपैड है तो आप वॉल्यूम के साथ कई फाइलों और गड़बड़ में लोड कर सकते हैं ताकि वे सब एक जैसे हों। साथ ही, यदि आपके पास फ़ाइल के कुछ अनुभाग हैं जो जोर से हैं, तो आप उस अनुभाग का चयन कर सकते हैं और उस खंड के लिए वॉल्यूम कम कर सकते हैं।

संपादित करें: और क्षमा करें, यह वास्तव में मात्रा मापने के लिए "विधि" नहीं है, लेकिन यदि आपको बस उन्हें सब कुछ करने की आवश्यकता है तो यह ठीक काम करना चाहिए।

2

PeterAllenWebb की प्रतिक्रिया करने के लिए जोड़ने के लिए:

इससे पहले कि आप आरएमएस की गणना के लिए, आप "केन्द्र" अपने नमूना पहले (एक 5 मिनट की .wav जहां प्रत्येक नमूने अधिकतम + आयाम के बारे में सोच) चाहिए। ऐसा करने का सबसे अच्छा तरीका एक सबसोनिक आवृत्ति पर एक हाईपास फ़िल्टर का उपयोग करना है।

वह अभी भी उन आवृत्तियों को नहीं लेगा जो मनुष्यों की गिनती के प्रति संवेदनशील हैं। ऐसा करने के लिए, आप ए-वेटिंग का उपयोग कर सकते हैं। http://www.diracdelta.co.uk/science/source/a/w/aweighting/source.html

कोड यहाँ हो रहा है: वहाँ एक पृष्ठ है जहाँ आप इसे ऑनलाइन की गणना कर सकते है http://www.diracdelta.co.uk/science/source/a/w/aweighting/multicalc.js

+0

से लिया गया है, मुझे लगता है कि आरएमएस द्वारा सामान्यीकरण वॉल्यूम में समान रूप से बराबर होने के समान पिच पर ध्वनि प्राप्त करने के मामले में शीर्ष मूल्य से सामान्यीकरण से बहुत बेहतर काम करता है, लेकिन आरएमएस माप पिच के लिए अपेक्षाकृत असंवेदनशील लगता है, इसलिए यह वही नहीं कर रहा है जो मैं चाहता हूं (जो हाई-पिक्चर ध्वनियों के लिए वॉल्यूम कम करना है)। वेबब के विकिपीडिया लिंक ने मानव श्रवण के लिए आवृत्ति प्रतिक्रिया वक्र दिखाया, लेकिन विशेष रूप से फ़ॉर्मूला के लिंक के लिए धन्यवाद - यह आज रात कोड में जा रहा है। – MusiGenesis

1

दोहराना करने के लिए कुछ अन्य लोगों ने क्या कहा है, आरएमएस मूल्य का प्रयोग कर एक पारित होने के "प्रबलता" अनुमान लगाने के लिए ध्वनि की

लेकिन, यदि आप छेड़छाड़ या ड्रम हिट जैसी आवेगपूर्ण आवाजों से निपट रहे हैं, तो आप एक स्लाइडिंग आरएमएस मूल्य करना चाहते हैं और केवल शीर्ष आरएमएस मूल्य चुनना चाहते हैं। ध्वनि के 100 एमएस को मापें, खिड़की को स्लाइड करें, फिर से मापें, आदि और फिर आपको मिलने वाले सबसे बड़े मूल्य के अनुसार सामान्यीकृत करें।

आरएमएस करने से पहले किसी भी डीसी मूल्य को निश्चित रूप से हटा दें, और ए-वेटिंग इसे और कैसे सुनेंगे।MATLAB/Octave और Python में ए-वेटिंग के लिए कोड यहां दिया गया है।