Синхронизация аудио и видео win

  • Автор темы Автор темы Lsw
  • Дата начала Дата начала
@Lsw, на будущее. Я не знаком с тонкостями работы Bitwig, но во избежание проблем в дальнейшем, рекомендовал бы придерживаться следующих правил:

- разрядность проекта строго 48000
- всё аудио попадающее в проект и не совпадающее с частотой проекта нужно заранее конвертировать в 48000 (если только вы 100% не уверены, что ваша DAW автоматически корректно ресэмплирует аудио)
- во время работы ОБЯЗАТЕЛЬНО иметь перед собой открытое окно с видео, синхронизированное с таймлайном.
- по окончании работы слить видео и полученный мастер звука в любой видеомонтажке и посмотреть на предмет возможных сюрпризов.
 
Последнее редактирование:
  • Like
Реакции: rHEAD и Lsw
вопрос актуальный.
Никто не знает и не может дать внятного ответа(

с рекордера звук медленнее, каждые 2 минуты натекает рассинхрон. Тоесть отстаёт от видео ряда.

есть программа, которая позволяет конвертировать звук из FPS 25, в FPS 24. Да, да, она конвертирует другую частоту кадров у звука. Или говоря корректнее, подгоняет с помощью пресета, звук, предназначенный для видео 24 FPS в звук для видео 25 FPS. Я проверял, это работает на примере стандартных звуковых дорожек фильмов с разным станадртным FPS. Но в связи с этим вопросы.
Как определить частоту кадров у звука, или какой параметр за это отвечает?
Данная программа не помогает в случае с связкой рекордер\камера
Все возможные конвертирования в 48, 32 44 не имеют абсолютно никакого результата. Это не влияет на длительность звуковой дорожки. Но конвертирование через программу давало изменения.

Читал на форуме хбт про кварцевые компоненты, но это абсолютно не актуально для следующего примера:
Была запись конференции в zoom, и отдельная запись звука в рипере. Как итог:
wav из reaper звучит медленнее, и спустя уже минуту начинает отставать от видео... Проблема такая-же. И там люди не нашли ответа.

zoom писал в variable 25 FPS, звук 32 HZ‍♀
Ну ок, я конвертировал всё возможное во все возмжные варианты. Всё равно, wav из рипера всегда начинает отставать от видео. Приходится каждые 2 минуты отрезать фрагмент и вручную подгонять под видео. Если ускорить всю дорожку, то это не работает) он где-то совпадает а где-то нет.. тоесть рассинхрон не линейный.

Кто нибудь может рассказать как это устранить?) Какие инструменты для аналитики звука покажут "скрытые параметры" потому-что ни медиа инфо ни другие инструменты ничего не говорят о настройках звука, из-за которых запись с диктофона начинает перманентно отставать от видео варианта, и почему вообще это происходит, как этого избежать в будущем?
 
@ExacT_true, вам правильно про кварцы сказали, рекордер отстаёт. Бывает такое. Грубо говоря, представьте, что два магнитофона пишут один и тот же сигнал, и у одного мотор работает чуть на других оборотах.

Больше никаких чудес нет.

но это абсолютно не актуально для следующего примера

боюсь, тут в чём то ещё косяк, просто так совпало
 
  • Like
Реакции: presly и dugdum®
@ExacT_true если у приборов нет единого клока, то всегда будет рассинхрон в той или иной мере. А путь наименее геморройный это писать аудио в прямо в камеру, в которую пишется видео. Отдельный рекордер только как подстраховка с неизменным двиганием потом дорожек ручками.

Про конференцию zoom интересно, но это просто говорит о том, что сам зум берет клок не с вашего компьютера. Он синхронизирует всё у себя на серваке и звуковой сигнал для записи миксуется и готовится там.
 
Как определить частоту кадров у звука, или какой параметр за это отвечает?
Частота кадров у камеры (видео), а у звука - частота дискретизации и она гораздо выше, чем у камеры.
В зависимости от формата и частоты дискретизации, на каждый кадр видео будет приходится разное число выборок (семплов).
Например (грубо):
25FPS 44100/25=1764 семплов на один кадр
при конвертации в 24FPS, Вы получите:
1764*24=42336, а за секунду проходит только 44100, вот звук и начинает убегать от видео.
Более развернуто, где-то в описании NTSC и PAL.
 
  • Sad
Реакции: Lachinio
на практике я давненько с заметным рассинхроном не сталкивался, на современном исправном оборудовании даже на моторе на 2-3часа без стопа не набегает хоть сколько-то заметно
 
  • Like
Реакции: dugdum® и Lachinio
что же делать если звук с рекордера не совпадает с звуком с камеры, подгонять в ручную каждые две минуты?)
Перерыл не одну дюжину зарубежных и ру форумов, нигде нет решения :(

Отдельный рекордер только как подстраховка с неизменным двиганием потом дорожек ручками.
вы только что причинили мне боль))

Про конференцию zoom интересно, но это просто говорит о том, что сам зум берет клок не с вашего компьютера. Он синхронизирует всё у себя на серваке и звуковой сигнал для записи миксуется и готовится там.

Если честно, в моей голове всё равно не укладывается, как 10 минут одной записи, происходят как будто в другом временном пространстве нежели аналогичные 10 минут другой записи.. Если точка 0 подгоняется, далее не должно быть рассинхрона но он есть.. Ну ладно старое оборудование на разных кварцах, но здесь то всё писалось на одном пк, в зум настройках даже нет такого понятия как клок. У меня на практике была не состыковка дорожек именно по клоку, но тогда достаточно было сопоставить общую точку 0 и всё было в порядке. А тут именно сам звук живёт иной жизнью нежели видеоo_O

@Lowcut, я это из теории понимаю. Но на практике, конвертирую звук в 32, 44, 48 и у него не будет изменений. Как не ложился под видео, так и не ложится. При этом длительность самой дорожки не меняется. Я не так конвертирую?)
Само видео конвертировал что в 24, что в 25, что в 30 и т.д. - без толку)
У меня бывали случаи когда дорожка 48 не подходила под видео ряд, а должна была быть в 44. Но в этом случае она даже звучала в другой тональности, и при конвертации в 44 действительно всё вставало на места.

А здесь как будто дело в чём-то ещё..

Есть ли здесь инженеры?) Нид хелп. Хочется разобраться в теме раз и навсегда.
 
Частота кадров у камеры (видео), а у звука - частота дискретизации и она гораздо выше, чем у камеры.
В зависимости от формата и частоты дискретизации, на каждый кадр видео будет приходится разное число выборок (семплов).
Например (грубо):
25FPS 44100/25=1764 семплов на один кадр
при конвертации в 24FPS, Вы получите:
1764*24=42336, а за секунду проходит только 44100, вот звук и начинает убегать от видео.
Более развернуто, где-то в описании NTSC и PAL.
@Lowcut не подумайте, что я к вам цепляюсь, но считают не совсем так, а вернее совсем не так.)
что же делать если звук с рекордера не совпадает с звуком с камеры, подгонять в ручную каждые две минуты?)
Перерыл не одну дюжину зарубежных и ру форумов, нигде нет решения :(


вы только что причинили мне боль))



Если честно, в моей голове всё равно не укладывается, как 10 минут одной записи, происходят как будто в другом временном пространстве нежели аналогичные 10 минут другой записи.. Если точка 0 подгоняется, далее не должно быть рассинхрона но он есть.. Ну ладно старое оборудование на разных кварцах, но здесь то всё писалось на одном пк, в зум настройках даже нет такого понятия как клок. У меня на практике была не состыковка дорожек именно по клоку, но тогда достаточно было сопоставить общую точку 0 и всё было в порядке. А тут именно сам звук живёт иной жизнью нежели видеоo_O
Сайт штейнберг
 
  • Love
Реакции: Lachinio
@Lowcut не подумайте, что я к вам цепляюсь, но считают не совсем так, а вернее совсем не так.)

Сайт штейнберг
Это что-то новое спасибо! Ушёл экспериментировать
@fakeitback, да это понятно) Но это решение последствий, а не первопричины. И это не объясняет почему подобное возникло в связке Zoom-DAW. То есть при повторном появлении проблемы, мы всё ещё будем безоружны :(

Отипшу по итогу экспериментов NTS\PAL
 
  • Like
Реакции: Trasher
@ExacT_true, а напишите по девайсам и форматам записи инфу то, плз

через меня еженедельно терабайты моторов проходят, и, честно слово, давным давно не припомню криминала

кстати, у вас там в качестве камеры не айфон с переменным фреймрейтом, например?
 
  • Like
Реакции: Trasher
но здесь то всё писалось на одном пк, в зум настройках даже нет такого понятия как клок.
вот представьте как работает zoom - у него есть сервер на котором производится микс и есть куча источников с разным клоком, с разных компов участников конфы. Совершенно логично предположить что сервер зума делает ресемплинг на лету от каждого источника и упаковывает данные по клоку сервера. Я тут повторяю наверное свою мысль, но иначе видеоконференцию не организовать и не синхронизировать источники с разным клоком. Когда вы у себя на компе включаете запись зума, вы записываете поток данных, который приходит с сервера, клок вашего компа - не участвует.
 
вы только что причинили мне боль))
тут правильно @fakeitback говорит, что с профессиональным рекордером и камерой проблем не будет. так как там к точности клока отношение другое. А если писать на телефон/комп с дешевым интерфейсом и прочее, то проблемы будут однозначно.
 
@ExacT_true, а напишите по девайсам и форматам записи инфу то, плз

через меня еженедельно терабайты проходят моторов, и, честно слово, давным давно не припомню криминала

кстати, у вас там в качестве камеры не айфон с переменным фреймрейтом, например?

Video
Format : AVC
Format/Info : Advanced Video Codec
Format profile : High@L5
Format settings : CABAC / 11 Ref Frames
Format settings, CABAC : Yes
Format settings, Reference frames : 11 frames
Codec ID : avc1
Codec ID/Info : Advanced Video Coding
Duration : 24 min 27 s
Bit rate : 530 kb/s
Frame rate mode : Constant
Frame rate : 25.000 FPS
Color space : YUV
Chroma subsampling : 4:2:0
Bit depth : 8 bits
Scan type : Progressive
Bits/(Pixel*Frame) : 0.010
Stream size : 92.8 MiB (81%)
Title : H.264/AVC video
Codec configuration box : avcC

Audio
ID : 1
Format : AAC LC
Format/Info : Advanced Audio Codec Low Complexity
Codec ID : mp4a-40-2
Duration : 24 min 27 s
Bit rate mode : Variable
Bit rate : 126 kb/s
Maximum bit rate : 158 kb/s
Channel(s) : 1 channel
Channel layout : M
Sampling rate : 32.0 kHz
Frame rate : 31.250 FPS (1024 SPF)
Compression mode : Lossy
Stream size : 22.1 MiB (19%)
Title : AAC audio
если инфо файл будет покорёжан, можно глянуть тут -
Звук с рипера - wav 48/24. Перегонялся во все возможные варианты 32 Hz, flac, aac и т.д. Но никогда это не влияло на длительность.
Перекодировал видео через HandBrake в 23.976 NTSC просто 0 изменений)) вообще ничего не поменялось.. мои кривые руки что-то не так конвертируют?)

Во втором случае именно ифон) именно с vbr 30 fps, а звук там был с рекордера. Ситуация аналогичная. Звук не бьётся с картинкой.

@dugdum®, представил. Легче не стало)) решение фикса так и не понял, за исключением покупки камеры на все случаи жизни. А запись с пк осуществлять через другой софт.

@Trasher, этот способ не сработал :(
 
У меня как-то похожее "несовмещение" было - так я просто "ускорил" аудио которое нужно подогнать в рипере - там же как раз в свойствах айтема мноого запятых после 1,000 - иожно выбрать коеффицент. - и длинна почти угадается и совместиться , после серии экспериментов.
Если есть исходное аудио - просто на глаз длину можно выровнять.
 
а это вот зачем, какие 32 килогерца вообще вместо стандартных 48000?


244772



Во втором случае именно ифон) именно с vbr 30 fps

никаких VBR в съёмке, видеоредакторы раком встают на их правильной интерпретации в проекте! Строго фиксированная частота кадров

это прикол для экономии места в памяти телефона сьёмочек для инсты

Перекодировал видео через HandBrake в 23.976 NTSC

перегоняйте видео в prores с нужной фиксированной частотой кадров (соответствующей настройкам секвенции в видемонтажке) и аудиодорожкой в wav 48000 (контейнер QT MOV)

ffmpeg или его мордатый друг Shutter Encoder в помощь

что-то мне подсказывает рекордер то как раз и в порядке получается…
 
  • Sad
Реакции: Lachinio
что же делать если звук с рекордера не совпадает с звуком с камеры, подгонять в ручную каждые две минуты?)
если материал не сильно боится последствий таймстретчинга, то ставьте два трека синхронно по началу, и конец одного из треков тяните в режиме Time Stretch, чтоб на другом конце файлы совпали. (полезно записать хлопок в ладоши перед началом полезного материала и в конце съёмки, перед нажатием камеры/рекордеров на стоп). Если есть критичные к растяжке/сжатию места (слышна деградация звука), то их придётся вырезать и не растягивая синхронить вручную.
 
  • Sad
Реакции: Lachinio
а это вот зачем, какие 32 килогерца вообще вместо стандартных 48000?


Посмотреть вложение 244772
никаких VBR в съёмке, видеоредакторы раком встают на их правильной интерпретации в проекте! Строго фиксированная частота кадров
перегоняйте видео в prores с нужной фиксированной частотой кадров и аудиодорожкой в wav 48000

ffmpeg или его мордатый друг Shutter Encoder в помощь

что-то мне подсказывает рекордер то как раз и в порядке получается…

То на что вы обратили внимание это звук 32 HZ в constant видео. Перегонял звук в 44, и в 48. Без толку.
Перегонял через reaper, adobe audition. Результаты идентичны между собой.
Само видео c zoom CBR

Видео перегонял с фиксированной частотой кадров и аудиодорожкой в wav 4800023 с constant FPS, 24, 25, 29 - они все идентичны получаются между собой, и опять таки не бьются с звуком который записан с reaperf 48\24
Перегонял через HandBrake и через Shutter. У них алгоритм сжатия отличается, но результаты идентичны (за исключением алгоритма сжатия)

касательно видео с ифона - вас понял. Попробую его по перегонять. О результатах отпишу здесь позднее.

что-то мне подсказывает рекордер то как раз и в порядке получается…
Да мне тоже так казалось. Один фиг под него подогнать не выходит) И его не получается подогнать под видео.

@V_ad_im,
так и пытался делать. Но в этом случае оно где-то бьётся а где-то нет. Приходится каждые 2 минуты двигать в ручную..

Похоже что нет рабочих способов синхронизировать, если уже имеется ошибка. Конвертирование видео\звука во все возможные форматы не приводит к нужному результату. Так или иначе приходится руками всё это править.
 

Вложения

  • Screenshot 2024-03-24 at 20.10.26.png
    Screenshot 2024-03-24 at 20.10.26.png
    28,5 KB · Просмотры: 44
  • Screenshot 2024-03-24 at 20.10.33.png
    Screenshot 2024-03-24 at 20.10.33.png
    70,9 KB · Просмотры: 43
А какой смысл в разные частоты перегонять? На какое бы количество ломтиков колбасу не нарезать, она от этого длиннеее/короче не станет
 
  • Like
Реакции: Lachinio
А какой смысл в разные частоты перегонять? На какое бы количество ломтиков колбасу не нарезать, она от этого длиннеее/короче не станет
я не знаю. Было предложение перегнать, я перегнал) У меня из практики был лишь один случай когда из-за не правильной частоты дискретизации что-то не то было с синхронизацией, но в этом случае и тональность звука была некорректная. Тогда изменение частоты помогло, но тут явно другой случай.

Штуку с хлопками регулярно используем, по ним и корректируемся в общем-то) Но увы..
 
насчёт зума — просто записывайте экран на том же компе, будет всё ок
 
@ExacT_true, разные звуковые устройства мю использовались? ЗУМ на встроенной карточке, рипер на внешней, например?

Ну или иначе такого не может быть. потому что не может быть)
 
@ExacT_true, разные звуковые устройства мю использовались? ЗУМ на встроенной карточке, рипер на внешней, например?

Ну или иначе такого не может быть. потому что не может быть)
одна звуковая карта, один комп. Запись в одно и тоже время - рассинхрон.
 
Грубо говоря, представьте, что два магнитофона пишут один и тот же сигнал, и у одного мотор работает чуть на других оборотах.
О, помню монтировал я в далёком 2007 свой первый рок-фест, на оцифрованное видео с кассеты накладывал звук с аудиокассеты. Это было незабываемо, когда плавает скорость и аудио, и видеоo_O
 

Сейчас просматривают