Перейти к основному содержимому

Руководство RX 11

Навигация по тексту

Обзор

Навигация по тексту преобразует речь в расшифровку и отображает ее над сигналограммой напротив соответствующих реплик. Можно искать по тексту расшифровки, и в файле автоматически появляются ориентиры. Больше не нужно слушать весь файл и самостоятельно ставить маркеры.

Назначение навигации по тексту

Навигация по тексту задумывалась как помощник для монтажа, а не как полноценный инструмент для расшифровки. Работает с американским вариантом английского. Точность может сильно различаться в зависимости от фонового шума или если говорящий имеет неамериканский акцент.

Инструкция по работе

Чтобы начать, перетащите или импортируйте звуковой файл в RX и щелкните кнопку, открывающую полосу распознанных слов, внизу слева от спектрограммы.

Кнопка распознавания речи

Сразу начнется фоновая расшифровка, которая займет примерно в 7-9 раз меньше реального времени файла. На полосе распознавания слов начнут появляться вкладки с распознанными словами.

Полоса слов

Звуковой материал должен отвечать следующим требованиям:

  • Запись должна содержать диалоги или речь. Расшифровка слов в песнях пока не поддерживается.

  • Звуковые файлы должны быть не короче 10 секунд. Распознавание речи не выполняется для более коротких файлов.

  • Пока что поддерживается только американский английский.

Щелкните логотип iZotope, чтобы открыть маленькое окно, показывающее ход расшифровки. В нижней части этого окна есть кнопки для приостановки или отмены расшифровки.

Ход расшифровки

По окончании расшифровки вы можете увеличить или уменьшить звуковой материал — расшифровка развернется или уменьшится соответственно.

  • Mac. Нажмите Cmd+=, чтобы увеличить, Cmd+-, чтобы уменьшить, или смахните двумя пальцами вверх или вниз на трекпаде.

  • Windows. Нажмите Ctrl+=, чтобы увеличить, или Ctrl+-, чтобы уменьшить.

Щелкните вкладку со словами, чтобы выбрать соответствующий звук в спектрограмме. Перетаскивайте маркеры слева и справа от вкладки, чтобы выделить слова рядом, всю фразу или все предложение.

При достаточно детальном масштабе, когда на вкладках уже идут отдельные слова, можно дважды щелкнуть слово и отредактировать его. Исправьте слово с ошибкой или поменяйте его на другое, если нужно.

  • В режиме редактирования, если ввести несколько слов, вкладка не разобьется на несколько вкладок.

  • Если стереть текст вкладки, она не удалится.

  • Если щелкнуть полосу слов правой кнопкой мыши, можно выбрать команду Rescan speech to text (Повторно сканировать речь в текст) для повторного сканирования. Все исправления слов потеряются.

Обнаружение нескольких говорящих

Встроенная возможность навигации по тексту, которая автоматически определяет несколько говорящих в записи и назначает цвета репликам, принадлежащим разным участникам диалога.

Обнаружение нескольких говорящих выполняется после расшифровки. оно может определить до 8 разных участников.

Каждый говорящий получает свой уникальный цвет, который видно на панели говорящих и на вкладках с его словами.

Панель говорящих

Чтобы выделить все реплики участника, щелкните его имя на панели говорящих. Так вы легко сможете обработать сразу все реплики этого участника.

Дважды щелкните имя участника, чтобы поменять его, если необходимо.

Экспорт расшифровки

Чтобы открыть меню экспорта расшифровки, щелкните кнопку для вызова меню наверху панели навигации по тексту или щелкните полосу слов правой кнопкой мыши.

Меню экспорта расшифровки
  • Copy transcript to clipboard (Скопировать расшифровку в буфер обмена). Копирует распознанный текст, чтобы его можно было вставить в какой-либо текстовый редактор.

  • Export transcript to file (Экспортировать расшифровку в файл). Сохраняет распознанный текст в файл .txt.

  • Rescan speech to text (Повторно сканировать речь в текст). Снова выполняет расшифровку в файле.