Часто мы пытаемся подогнать наш микс под какой-то внутренний эталон. Под какой-то знакомый и любимый нами микс.
Все хорошие миксы можно подвести под какую-то единую характеристику (типа как число пи для окружностей. Все они разные по размеру, но характеризуются одним коэффициентом).
Сразу слышно, что не хватает баса, или высоких слишком много, или микс грязный и т.п. Я не говорю о каком-то микроскопическом вмешательстве, о вырезании резонансов, а о какой-то общей характеристике.
Так вот, решил я подойти к этому делу с математической точки зрения.
Как известно, слышим частоты мы логарифмически. В спектроанализаторе также для удобства частоты представлены на логорифмическом графике (точнее, ось х - логарифмическая).
Есть такая вещь, как аппроксимация. То есть, грубо говоря, набор точек на диаграмме можно привести к како-му то единому уравнению, естественно, с определенной долей достоверности (в школе, если помните, парили нам мозги, по нескольким точкам пытались установить, какому закону подчиняется их последовательность).
Итак, график зависимости амплитуды частоты от самой частоты строится в логарифмической шкале. Если мы построим в этой шкале уравнение логарифма, то он будет иметь вид прямой линии.
Таким образом, если мы аппроксимируем спектр нашего микса в какое-то логарифмическое уравнение, мы получим усредненный спектр в виде прямой с уравнением вида y=k*ln(x)+b (опять же, в обычной системе координат уравнение прямой будет y=k(x)+b, из школы все помнят),
где k - тангенс угла наклона данного графика к оси х,
b - расположение нашего графика выше-ниже (то есть, чем громче RMS микса, тем прямая находится выше, и наоборот).
Исходя из этого, величиной b можно пренебречь, остается k.
Этим коэффициентом можно охарактеризовать наклон спектра к оси х (что он собственно и делает), а следовательно, и спектральный баланс микса. Чем более параллелен спектр к оси х (k стремится к нулю), тем более равномерно представлены все частоты в миксе. Чем больше баса в миксе, тем наклон графика сильней, чем больше высоких, тем слабей (k -> минус бесконечность).
Но частотные диапазоны в разной степени влияют на наклон графика (как и всем известно, бас имеет большее влияние на общий баланс микса, чем высокие. Точнее, если мы поднимем бас на 6дб, то это окажет большее влияние на общий спектр, чем поднятие высоких на эту же величину), так как шкала логарифмическая. Да и визуально все видно, взглянув на шкалу анализатора - частоты от 10 до 100Гц занимают то же количество шкалы, что и 1000-10000Гц!
Теперь к практике.
В програмее Spectralab есть возможность экспортировать данные в виде таблицы "частота - громкость" например в Excell.
Далее средствами экселя можно аппроксимировать график в логарифмическую кривую и получить ее уравнение, что собственно я и сделал.
Я взял несколько имеющихся у меня треков в формате flac, в спектралабе снял их спектр в режиме average c размером FFT 2048 точек (то есть график строится по 2048 точкам, чего вполне достаточно для характеристики общего спектрального баланса микса) и загнал их в эксель, проделал все описанные манипуляции вот с такими треками:
Prodigy - breathe
Prodigy - disel power
Prodigy - firestarter
Michael Brook - Scissorspaperrock
Pink noise.
Вот что получилось:
Обратите внимание на очень близкое значение коэффициентов у треков Prodigy, взятых с одного альбома: -10; -11,1; -10,5.
Еще заметка. Вроде как розовый шум считается "оптимальным" спектром, но, исходя из графика, он ничего общего в этом контектсте с профессиональными миксами не имеет.
Итак, собственно, интересует Ваше мнение по поводу всего прочитанного, пожелания, исправления, советы и просто мысли.
Может уже есть литература/статьи/опыты по этому поводу.
Давайте найдем пи для музыки
PS, только очень прошу без флуда.
Все хорошие миксы можно подвести под какую-то единую характеристику (типа как число пи для окружностей. Все они разные по размеру, но характеризуются одним коэффициентом).
Сразу слышно, что не хватает баса, или высоких слишком много, или микс грязный и т.п. Я не говорю о каком-то микроскопическом вмешательстве, о вырезании резонансов, а о какой-то общей характеристике.
Так вот, решил я подойти к этому делу с математической точки зрения.
Как известно, слышим частоты мы логарифмически. В спектроанализаторе также для удобства частоты представлены на логорифмическом графике (точнее, ось х - логарифмическая).
Есть такая вещь, как аппроксимация. То есть, грубо говоря, набор точек на диаграмме можно привести к како-му то единому уравнению, естественно, с определенной долей достоверности (в школе, если помните, парили нам мозги, по нескольким точкам пытались установить, какому закону подчиняется их последовательность).
Итак, график зависимости амплитуды частоты от самой частоты строится в логарифмической шкале. Если мы построим в этой шкале уравнение логарифма, то он будет иметь вид прямой линии.
Таким образом, если мы аппроксимируем спектр нашего микса в какое-то логарифмическое уравнение, мы получим усредненный спектр в виде прямой с уравнением вида y=k*ln(x)+b (опять же, в обычной системе координат уравнение прямой будет y=k(x)+b, из школы все помнят),
где k - тангенс угла наклона данного графика к оси х,
b - расположение нашего графика выше-ниже (то есть, чем громче RMS микса, тем прямая находится выше, и наоборот).
Исходя из этого, величиной b можно пренебречь, остается k.
Этим коэффициентом можно охарактеризовать наклон спектра к оси х (что он собственно и делает), а следовательно, и спектральный баланс микса. Чем более параллелен спектр к оси х (k стремится к нулю), тем более равномерно представлены все частоты в миксе. Чем больше баса в миксе, тем наклон графика сильней, чем больше высоких, тем слабей (k -> минус бесконечность).
Но частотные диапазоны в разной степени влияют на наклон графика (как и всем известно, бас имеет большее влияние на общий баланс микса, чем высокие. Точнее, если мы поднимем бас на 6дб, то это окажет большее влияние на общий спектр, чем поднятие высоких на эту же величину), так как шкала логарифмическая. Да и визуально все видно, взглянув на шкалу анализатора - частоты от 10 до 100Гц занимают то же количество шкалы, что и 1000-10000Гц!
Теперь к практике.
В програмее Spectralab есть возможность экспортировать данные в виде таблицы "частота - громкость" например в Excell.
Далее средствами экселя можно аппроксимировать график в логарифмическую кривую и получить ее уравнение, что собственно я и сделал.
Я взял несколько имеющихся у меня треков в формате flac, в спектралабе снял их спектр в режиме average c размером FFT 2048 точек (то есть график строится по 2048 точкам, чего вполне достаточно для характеристики общего спектрального баланса микса) и загнал их в эксель, проделал все описанные манипуляции вот с такими треками:
Prodigy - breathe
Prodigy - disel power
Prodigy - firestarter
Michael Brook - Scissorspaperrock
Pink noise.
Вот что получилось:
Обратите внимание на очень близкое значение коэффициентов у треков Prodigy, взятых с одного альбома: -10; -11,1; -10,5.
Еще заметка. Вроде как розовый шум считается "оптимальным" спектром, но, исходя из графика, он ничего общего в этом контектсте с профессиональными миксами не имеет.
Итак, собственно, интересует Ваше мнение по поводу всего прочитанного, пожелания, исправления, советы и просто мысли.
Может уже есть литература/статьи/опыты по этому поводу.
Давайте найдем пи для музыки
PS, только очень прошу без флуда.