Synthesizer V Pro (Synth V) — голосовой синтезатор японского производителя, построенный на AI (обучающихся моделях). Человеческий певец приходит в студию, поёт много-много песен, по возможностям и умению — на разных языках. Потом машина всё напетое уцифровывает всего в несколько сотен мегабайт. И дальше с голосами можно делать очень многое: вписывать свой текст, менять громкость, форманты, вибрацию, портаменто.
Основные ресурсы:
https://dreamtonics.com/ — сайт и магазин производителя синтезатора;
https://forum.synthesizerv.com/ — полуофициальный форум;
Ветка на vi-control;
Обучающие ролики на youtube;
Eclipsed Sounds — ещё один производитель голосов для Synth V.
Что хотелось бы видеть в этой теме. Удачные примеры работ. Обучающие ролики. Результаты своих поисков и экспериментов. Ссылки, помогающие приобретающим сэкономить, промо-коды, распродажи. Новости от производителей голосовых баз данных (называть эти продукты библиотеками не совсем верно).
Что и кого не хотелось бы видеть в этой теме. Обсуждение общих вопросов применения AI в музыке — для этого есть темы во флейме. Неудачные примеры криворуких имитаторов. Пошляков с шутками за триста про резиновых баб. Вообще, досужие сетования на то, что всё это неживое — синтетический оркестр в кино все потребляют, на изжогу не жалуются, а тем временем первый коммерческий альбом с песнями, спетыми искусственными голосами, уже вышел в Японии.
Пара примеров. Я предпочитаю примеры голосов без навороченного аккомпанемента (ритм-группы), чтобы всё было слышно. Такие примеры редки на сайтах производителей голосовых баз данных, приходится их искать по ютубу и форумам.
Synthesizer V Natalie: Amazing Grace 2023 (a cappella), автор мокапа — Mizuki Tachibana. Насколько я понимаю, почти все голоса здесь — Natalie.
В следующем примере все голоса, кроме ведущего, сняты (забиты) местами довольно неаккуратно, прежде всего ритмически, но это здесь не принципиально. Можно сравнить с оригиналом, откуда и взята картинка. Здесь пять разных голосов: Solaria, Cong Zheng, Kevin, Xuan Yu, Asterian.
Понятно, что копировать хорошие образцы живых коллективов гораздо-гораздо проще, чем с нуля прописать голос в новой песне. Та же самая проблема, что и с симфоническими имитациями: известный дирижёр много-много поработал с высокопрофессиональным оркестром, сделал запись в хорошем зале или студии, а потом умельцы подобрали сэмплы под отработанную кем-то фразировку, баланс, темпы. Не без воровства процесс, и я сейчас не про соблюдение копирайта, а о создании себе имени на этом некоторыми синтетическими аранжировщиками. Но как шаг к освоению технологии — почему бы и нет.
======
Существует две версии синтезатора, обычная и Про. Первая бесплатна, но по части редакции не даёт делать практически ничего. У неё есть и лицензионные ограничения: нельзя использовать коммерчески и следует обязательно указывать везде используемые голоса и название программы. Большинство голосов можно скачать бесплатно и работать с ними в бесплатной версии. Но поскольку сделать толком ничего нельзя в таком комплекте, дальше мы будем обсуждать только версию Про ($ 89.00).
В русскоязычном пространстве работающих с этими голосовыми БД мало, их практически не видно. И я долго сомневался, стоит ли открывать тему. Однако предстоящие изменения в возможностях Synth V (компании всего-то года три-четыре), новый обещанный функционал заставляют уделить ему внимание. У Synth V есть бета-программа, записаться в бета-тестеры может любой желающий. Я этого не делаю, поскольку нельзя в одной системе иметь и бета-, и рабочую версию, а я только осваиваюсь. Однако вот о чём я прочитал и что увидел. В последних бетах появилась возможность
— напеть своим (возможно, дурным) голосом фразу в нужном ощущении темпа, что лучше, чем рисовать мышкой ноты, пытаясь это ощущение угадать;
— после дать синтезатору проанализировать напетое; синтезатор а) распознает все ноты (уже отлично справляется), б) распознает все флуктуации и вибрации, здесь можно выбрать, оставить ли свои или отдать на усмотрение Synth V, в) распознает все фонемы, согласные и гласные (пока это работает так себе, в стадии доведения до ума);
— после анализа можно подставить любой из голосов, имеющихся в наличии и далее работать с ним «обычным» образом — менять ноты, стретчить, менять форманты, вибрацию, портаменто, громкость, и т. п.
И самое многообещающее: грядёт поддержка ARA-технологии (в Кубейсе 12 и 13 прямая, в Лоджике через бридж), что на порядок облегчит работу с голосами. В самом начале пути Synth V был в стэнд-элон версии, и гонять из него в DAW и обратно сэмплы было тем ещё наслаждением.
Немного непривычно смотреть ролики, в которых основной язык японский, а английский — так, какой-то периферийный. Нате вам титры, и не жалуйтесь.
О предстоящих нововведениях в версии 1.11.0:
Продолжение следует (немного лайфхаков ради неупущенной выгоды).
Основные ресурсы:
https://dreamtonics.com/ — сайт и магазин производителя синтезатора;
https://forum.synthesizerv.com/ — полуофициальный форум;
Ветка на vi-control;
Обучающие ролики на youtube;
Eclipsed Sounds — ещё один производитель голосов для Synth V.
Что хотелось бы видеть в этой теме. Удачные примеры работ. Обучающие ролики. Результаты своих поисков и экспериментов. Ссылки, помогающие приобретающим сэкономить, промо-коды, распродажи. Новости от производителей голосовых баз данных (называть эти продукты библиотеками не совсем верно).
Что и кого не хотелось бы видеть в этой теме. Обсуждение общих вопросов применения AI в музыке — для этого есть темы во флейме. Неудачные примеры криворуких имитаторов. Пошляков с шутками за триста про резиновых баб. Вообще, досужие сетования на то, что всё это неживое — синтетический оркестр в кино все потребляют, на изжогу не жалуются, а тем временем первый коммерческий альбом с песнями, спетыми искусственными голосами, уже вышел в Японии.
Пара примеров. Я предпочитаю примеры голосов без навороченного аккомпанемента (ритм-группы), чтобы всё было слышно. Такие примеры редки на сайтах производителей голосовых баз данных, приходится их искать по ютубу и форумам.
Synthesizer V Natalie: Amazing Grace 2023 (a cappella), автор мокапа — Mizuki Tachibana. Насколько я понимаю, почти все голоса здесь — Natalie.
В следующем примере все голоса, кроме ведущего, сняты (забиты) местами довольно неаккуратно, прежде всего ритмически, но это здесь не принципиально. Можно сравнить с оригиналом, откуда и взята картинка. Здесь пять разных голосов: Solaria, Cong Zheng, Kevin, Xuan Yu, Asterian.
Понятно, что копировать хорошие образцы живых коллективов гораздо-гораздо проще, чем с нуля прописать голос в новой песне. Та же самая проблема, что и с симфоническими имитациями: известный дирижёр много-много поработал с высокопрофессиональным оркестром, сделал запись в хорошем зале или студии, а потом умельцы подобрали сэмплы под отработанную кем-то фразировку, баланс, темпы. Не без воровства процесс, и я сейчас не про соблюдение копирайта, а о создании себе имени на этом некоторыми синтетическими аранжировщиками. Но как шаг к освоению технологии — почему бы и нет.
======
Существует две версии синтезатора, обычная и Про. Первая бесплатна, но по части редакции не даёт делать практически ничего. У неё есть и лицензионные ограничения: нельзя использовать коммерчески и следует обязательно указывать везде используемые голоса и название программы. Большинство голосов можно скачать бесплатно и работать с ними в бесплатной версии. Но поскольку сделать толком ничего нельзя в таком комплекте, дальше мы будем обсуждать только версию Про ($ 89.00).
В русскоязычном пространстве работающих с этими голосовыми БД мало, их практически не видно. И я долго сомневался, стоит ли открывать тему. Однако предстоящие изменения в возможностях Synth V (компании всего-то года три-четыре), новый обещанный функционал заставляют уделить ему внимание. У Synth V есть бета-программа, записаться в бета-тестеры может любой желающий. Я этого не делаю, поскольку нельзя в одной системе иметь и бета-, и рабочую версию, а я только осваиваюсь. Однако вот о чём я прочитал и что увидел. В последних бетах появилась возможность
— напеть своим (возможно, дурным) голосом фразу в нужном ощущении темпа, что лучше, чем рисовать мышкой ноты, пытаясь это ощущение угадать;
— после дать синтезатору проанализировать напетое; синтезатор а) распознает все ноты (уже отлично справляется), б) распознает все флуктуации и вибрации, здесь можно выбрать, оставить ли свои или отдать на усмотрение Synth V, в) распознает все фонемы, согласные и гласные (пока это работает так себе, в стадии доведения до ума);
— после анализа можно подставить любой из голосов, имеющихся в наличии и далее работать с ним «обычным» образом — менять ноты, стретчить, менять форманты, вибрацию, портаменто, громкость, и т. п.
И самое многообещающее: грядёт поддержка ARA-технологии (в Кубейсе 12 и 13 прямая, в Лоджике через бридж), что на порядок облегчит работу с голосами. В самом начале пути Synth V был в стэнд-элон версии, и гонять из него в DAW и обратно сэмплы было тем ещё наслаждением.
Немного непривычно смотреть ролики, в которых основной язык японский, а английский — так, какой-то периферийный. Нате вам титры, и не жалуйтесь.
О предстоящих нововведениях в версии 1.11.0:
Продолжение следует (немного лайфхаков ради неупущенной выгоды).
Последнее редактирование: