Перейти к основному содержимому

Руководство RX 11

Спектрограмма с сигналограммой

Обзор

RX Audio Editor предлагает универсальную визуальную среду для редактирования и реставрации звука. Основным элементом программы является спектрограмма с сигналограммой. Сигналограмма накладывается поверх спектрограммы (с настраиваемой прозрачностью) для обзора как частотной, так и амплитудной информации в гибко настраиваемом представлении.

Использование спектрограммы для диагностики звука

См. статью «Диагностика материала», чтобы узнать, как с помощью спектрограммы выявить те или иные недостатки в звуковом материале.

Как устроена спектрограмма

Спектрограмма одновременно отображает информацию и о частотах, и об амплитудах в аудиозаписи.

Частота

Информация о частотах располагается по вертикальной оси спектрограммы. Самая низкая частота отображается внизу, а самая высокая — наверху.

Синусоидная развертка в спектрограмме

На скриншоте изображена спектрограмма синусоидной развертки в розовом шуме. Синусоидная развертка начинается с 20 Гц (внизу) и идет до 20 кГц (наверху) на протяжении 4 минут.

Кодирование амплитуд цветом

Амплитуда частотного спектра представлена в спектрограмме разными цветами. На шкале градаций цветов (справа от шкалы частот) указаны цвета, обозначающие ту или иную амплитуду.

Обозначение цветами в спектрограмме

В данном примере более громкие частоты (речь) имеют яркие цвета (желтый и светло-оранжевый), а тихие частоты (паузы в речи и шумовой фон) более темные (темно-оранжевый, синий, черный)

Настройки спектрограммы

Спектрограмма гибко настраивается в RX: вы можете изменить стандартную конфигурацию, загрузить заготовку параметров или сохранить собственную заготовку в окне Spectrogram Settings (Настройки спектрограммы).

Окно настроек спектрограммы открывается разными способами:

  • Откройте меню View (Вид) в RX Audio Editor.

  • Щелкните правой кнопкой мыши на спектрограмме и выберите команду Spectrogram Settings (Настройки спектрограммы) в контекстном меню.

  • Нажмите сочетание клавиш: Cmd+ Shift+ , (Mac) или Ctrl+ Shift+ , (Windows).

Настройки спектрограммы

Виды спектрограмм

RX пможет по-разному отображать частотную и амплитудную информацию в спектрограмме. Продвинутые режимы спектрограммы в RX позволяют увеличить резкость как по временной (горизонтальной) оси, так и по частотной (вертикальной) оси. Более качественное отображение всегда идет за счет более длительной обработки, поэтому в некоторых режимах прорисовка изображения будет идти дольше.

Вид

Описание

REGULAR STFT
(Обычный с кратковременным преобразованием Фурье)

Пример обычного вида с кратковременным преобразованием Фурье

Самый распространенный вид спектрограммы (используется повсеместно в разных редакторах). Имеет фиксированное временно-частотное разрешение. Самый простой и быстрый режим отображения в RX.

AUTO-ADJUSTABLE STFT
(Регулируемый с кратковременным преобразованием Фурье)

Пример регулируемого вида с кратковременным преобразованием Фурье

Размер БПФ (то есть временное и частотное разрешение спектрограммы) автоматически регулируется в соответствии с уровнем масштабирования. Например, если вы увеличите масштаб по горизонтали (по оси времени), станут лучше видны резкие перкуссивные звуки и транзиенты. А если вы увеличите масштаб по вертикали (по оси частот), станут лучше видны отдельные музыкальные ноты и частоты.

MULTI-RESOLUTION
(Переменное разрешение)

Пример переменного разрешения

Спектрограмма получает лучшее частотное разрешение на нижних частотах и лучшее временное разрешение на верхних частотах. Имитирует психоакустику человеческого восприятия, чтобы в спектрограмме отображалась только наиболее важная информация.

ADAPTIVELY SPARSE
(Адаптивно разреженный)

Пример адаптивно разреженного вида

Временное и частотное разрешение спектрограммы меняется автоматически, чтобы в любой области временно-частотного графика четкость спектрограммы была максимальной. Подходит для самого тщательного анализа, но требует много времени на вычисление.

FFT Size (Размер БПФ)

Чем он больше, тем лучше частотное разрешение, то есть ноты и частоты при увеличении будут более четкими. Однако, если указать здесь большое значение, отображение спектра по времени потеряет четкость — такова особенность вычислений. В режимах Auto-adjustable (Регулируемый) и Multi-resolution (Переменное разрешение) хорошо соблюдается баланс между частотным и временным разрешением без необходимости менять параметр FFT size в ходе работы.

Быстрое преобразование Фурье (БПФ)

Так называется процедура вычисления частотного спектра сигнала. Чем больше размер БПФ, тем больше частотное разрешение, то есть ноты и частоты при увеличении становятся более четкими.

Enable Reassignment (Разрешить перераспределение)

Специальная техника расчета спектрограммы, позволяющая очень точно отслеживать высоту тона гармонических составляющих сигнала. Вместе с параметрами Frequency Overlap (Перекрытие по частотам) и Time Overlap (Перекрытие по времени) может дать практически бесконечное разрешение и по частотам, и по времени для тональных сигналов.

Пример перераспределения

Window (Окно)

Выбор весовой функции (или окна), используемой для анализа на основе быстрого преобразования Фурье. Разные оконные функции дают разные величины потери сигнала между выборками частот БПФ. Более «слабые» оконные функции по типу Rectangular (Прямоугольная) дают большие потери сигнала, из-за чего спектрограмма размывается по вертикали. Более «сильные» функции, такие как Kaiser (Кайзера) или cos3, не имеют потерь за счет чуть более низкого разрешения частот.

Frequency Scale (Шкала частот)

Для визуализации может быть удобна та или иная частотная шкала: все они по-разному отображают информацию о частотах (по вертикали).

  • Linear (Линейная). Частоты распределяются по вертикали равномерно. Эта шкала удобна для анализа верхних частот.

  • Logarithmic (Логарифмическая). На этой шкале лучше различимы нижние частоты.

  • Mel (Мелодическая). Основана на человеческом восприятии звука. С помощью этой шкалы вы сможете работать интуитивно, поскольку она отображает частоты по высоте тона так, как они слышатся.

  • Bark (Шкала барков). Тоже основана на человеческом восприятии звуков, связана с критическими полосами слуха.

Frequency Overlap (Перекрытие по частотам)

Управляет величиной выборки с запасом для частотной шкалы спектрограммы. Вместе с параметром Enable reassignment (Разрешить перераспределение) дает более высокое вертикальное разрешение спектрограммы (по частоте).

Time Overlap (Перекрытие по времени)

Управляет величиной выборки с запасом для временной шкалы спектрограммы. В большинстве случаев перекрытия 4x или 8x бывает вполне достаточно. Но тем не менее, более высокое временное перекрытие вместе с параметром Enable reassignment (Разрешить перераспределение) увеличит временное разрешение спектрограммы, благодаря чему транзиенты станут отчетливее.

Color Map (Цветовая схема)

Можно выбрать различные цветовые схемы спектрограммы. Не бывает правильной или неправильной цветовой схемы — смело пробуйте и выбирайте ту, которая вам больше нравится. Иногда в какой-то цветовой схеме определенные виды шума кажутся более отчетливыми.

High-Quality Rendering (Высококачественный рендеринг)

Точная билинейная интерполяция спектрограммы. Рекомендуется не выключать. Если выключить этот параметр, спектрограмма будет отрисовываться чуть быстрее, но вы потеряете в детальности и четкости изображения.

Reduce Quality Above (Понизить качество, если длиннее)

Спектрограмма RX отрисовывается очень точно, благодаря чему можно искать различные помехи и щелчки даже на невысоких уровнях масштабирования. Однако, если файл длинный, его отрисовка может идти очень долго. Если длительность отображаемого отрезка спектрограммы больше указанного количества секунд, расчет спектрограммы выполняется быстрее с меньшей точностью. Когда вы увеличите видимую область, вычисление спектрограммы снова станет точным.

Cache Size (MB) (Размер кэша (МБ))

Ограничение количества памяти, используемого спектрограммой.

Шкалы

Справа от спектрограммы с сигналограммой находятся амплитудная шкала для сигналограммы и частотная и цветовая шкалы для спектрограммы.

Шкалы амплитуд

Чтобы выбрать желаемую шкалу амплитуд, щелкните обозначения амплитуд справа правой кнопкой мыши:

  • dB (Децибелы). Уровни сигналограммы отображаются в децибелах относительно цифровой полной шкалы (самый распространенный вид шкалы среди анализаторов спектра).

  • Normalized (Нормированная). Уровни сигналограммы отображаются в единичной шкале.

  • 16 bit (16-битная). Отображение сигналограммы по уровням квантования в 16-битном формате звука (от -32768 до +32767).

  • Percent (Процентная). Отображение сигналограммы в процентах полной шкалы.

Цветовая шкала

Эта шкала показывает цвета, соответствующие амплитудам. Она отображает динамический диапазон спектрограммы RX. Для изменения размера диапазона перетащите цветовую шкалу или прокрутите над ней колесико мыши. Это удобно для просмотра очень тихих шумов без необходимости усиления самого звукового сигнала.

Шкалы частот

Щелкните частотную шкалу правой кнопкой, чтобы выбрать ее разновидность:

  • Linear (Линейная). На такой шкале герцы отображаются на экране равномерно.

  • Mel (по умолчанию) и Bark (Мелодическая шкала и шкала барков). Используются в психоакустике, соответствуют человеческому восприятию звуковысотности. Эти шкалы приблизительно линейные ниже 500 Гц и приблизительно логарифмические выше 500 Гц.

    • Мелодическая шкала соответствует нашему восприятию высоты тона: последовательное субъективное повышение высоты тона соответствует равномерному повышению экранных координат.

    • Шкала барков отражает субъективное восприятие громкости и суммарной акустической энергии. Подобна мелодической шкале, но здесь больший акцент на нижних частотах.

  • Log (Логарифмическая). Расстояние между октавами на экране показано одинаковым. Экранные координаты пропорциональны логарифмическому графику герц, идущему до 100 Гц.

  • Extended log (Расширенная логарифмическая). Расширенная логарифмическая шкала, идущая до 10 Гц, то есть в ней больше внимания уделено нижним частотам.

  • Piano roll overlay (Проекция клавишной ленты). Щелкните частотную шкалу правой кнопкой и выберите этот параметр, чтобы наложить на шкалу клавишную ленту, показывающую соответствие частот европейскому музыкальному звукоряду. Чтобы отображались только клавиши без частот, снимите флажок в подменю Show Frequencies (Отображать частоты).

Отображение сигналограммы

Под спектрограммой есть специальный ползунок, позволяющий наложить на спектрограмму сигналограмму с настраиваемой прозрачностью.

Ползунок прозрачности

С его помощью можно просматривать и частотную, и амплитудную составляющие сигнала одновременно. Эта функция окажет неоценимую помощь в быстром поиске перегрузки, щелчков, треска и прочих помех.

Примеры настройки ползунка прозрачности

Общий вид сигналограммы

В верхней части окна RX над спектрограммой с сигналограммой отображается общее представление сигналограммы звукового файла. Ориентируясь по нему, удобно масштабировать видимую область и выделять отрезки.

Общее представление сигналограммы

В общем виде сигналограммы всегда отображается весь файл, также в нем отражаются все выделения, сделанные в основном представлении ниже. При увеличении звукового материала на общем виде обозначается текущая видимая область. Перетаскивайте это обозначение видимой области, чтобы прокручивать видимую область влево или вправо, или перетаскивайте края обозначения, чтобы сделать масштаб уже или шире. Чтобы отобразить весь файл, просто дважды щелкните в обозначении видимой области.

Примечание

Наведите указатель мыши на общий вид сигналограммы и прокрутите колесиком, чтобы масштабировать амплитуду сигналограммы для лучшего обзора. Масштаб амплитуд в основном представлении не поменяется.