Нейросети пришли и к нам. (6 онлайн)

В тему о различии с реальной музыкой.
Ребята в музыкальном чатике восторгались "невероятным уровнем" нейросеток, мол, дабстеп уже не надо писать руками, нейронки всё сделают. Пришлось сделать простой пример, чтобы подчеркнуть до сих пор существующие недостатки нейронок.

Сперва Суно 5, потом какой-то Virtual Riot (2013):

Посмотреть вложение 268912

Если у кого-то остаются вопросы, перечисляю косяки Суно в данном сравнении:
1. Тише звук. Это даже визуально по волноформе выглядит, будто лимитер забыли включить на мастере.
2. Весьма узкое "стерео". Всё топчется примерно на уровне "широкого моно", нет игр с панорамой, нет чередования широких/узких элементов, нет панорамированных элементов.
3. Не рельефные звуки синтов. То, о чём я уже писал выше - сложные звуки превращаются в кашу. Подобное я наблюдал у плотных оркестров, дисторшн гитар и синтов (суперпилы). Это тянется прям с ранних генераций, до нынешних дней. Полагаю, такая же не решаемая проблема, что и с пальцами/клавиатурами у генераторов изображений.
4. В один момент звучит только один звук. Малое разнообразие тембров. Условно, это можно отнести к задумке композиции. Но когда у Виртуал Риот под дабстеповыми синтами появляется арпеджио на втором плане - это делает музыку глубже и интереснее.
5. Сайдчейн в начале отрезка не в ритм.
6. Ещё одна глобальная проблема, то, что не попало в этот пример из-за малой длины отрезка: ритм порой сбивается. Нет строгого метронома под bpm, композиция может внезапно "заикнуться" на 1/64 ноту. Это так же отмечал мой коллега, которому много нейро демок присылают. Постоянно приходится резать, а если демку раздают разным музыкантам, могут быть проблемы.
7. Так же, не попало в демку, но стоит отметить: местами грубые переходы между частями. Fills в новых версиях Суно значительно лучше, чем в ранних, но всё ещё есть шанс получить внезапное заполнение, будто вместо перехода часть грубо подклеена.

Что по итогу? Да всё так же, как и раньше. Мы имеем некий генератор демок (на сколько они будут разнообразны - вопрос открытый), но это совсем не финальный продукт.
"Тише звук. Это даже визуально по волноформе выглядит, будто лимитер забыли включить на мастере" - или сплющенный колбасообразный продукт cо странными искажениями, но в целом динамика звука воспринимается как ксерокопия ксерокопии на выходе.
Фраза описывает все ощущения - "сложные звуки превращаются в кашу", полностью согласен.
Хотя, как инструмент снятия творческого блока работает, кмк. "Мы имеем некий генератор демок" - скорее генератор подсказок, некий калейдоскоп, который из огромной базы предлагает несколько вариантов в рамках заданной промптом идеи и общих музыкальных правил жанра и гармонии. Если идея подробно и правильно расписана - даст что-то интересное, если идея описана общими безликими слишком широкими мазками, то и на выходе что-то усредненное, среднестатистическое. Всё сугубо имхо.
В кавычках цитаты
 
Последнее редактирование:
  • Like
Реакции: MPP
дабстеп уже не надо писать руками
Сейчас, я как раз погружен в изучение устройства ломанных ритмов и жанров на них и скажу так:

Нет, так нельзя. Аргумент - саунд-дизайн, он там максимально авангардный и мы можем дать себе полный карт-бланш. Причудливые формы LFO, неочевидные источники для модуляции, полный улёт и слом мозга. Нейросеть - будет гулять вокруг нескольких клише. "Генератор демок" - может быть, но проблема аналогична, упремся в повторяемость.
 
Музыкальные лейблы будут лицензировать контент разработчикам для «этичного» обучения ИИ.

Лейблы хотят, чтобы разработчики ИИ создали технологию по образцу системы идентификации YouTube, определяющей, когда используется их музыка.

 
  • Like
Реакции: Ilya Prokhorov
Насчет творчества, если просто жмакать кнопку "Create", то да, это про совсем-совсем не "твое".
А если ты дал ИИ свой исходник, подсказывал ему как, что и где сделать, менял варианты и пр. Если кто не знает, то у Suno есть свои правила для разметки. То как быть в этом случае? Вроде и принимал участие, но все-равно не твое?
Не твоё. Прав нет. Законодательно - только человек может быть наделён правами в этой сфере.
И творчество - деятельность исключительно человека.
Никакого совместного творчества с ИИ - быть не может по-определению.
ИИ не может быть ни исполнителем, ни автором музыки, ни аранжировки, ни производителем фонограмм. Только человек.

А так как отсутствует право авторства, право на имя, право на неприкосновенность, право на обнародование - можно смело поступать с ИИ-генерациями как угодно. Они бесправны.
Недавний пример - сервис Spotify, преспокойно удаливший из библиотек 75 миллионов спам-треков (ИИ-генераций).
И што? И ничего.
А удалили бы хоть один трек Дуа Липы или другого защищённого в правах артиста? Не-а.
Музыкальный продукт всегда тесно связан с правами. И именно наличие/отсутствие прав, отвечает на вопрос - твоё/нет.

Но на мой взгляд Suno ценен не этим. За совсем немного денег ты можешь быстро прикинуть разные варианты (пусть пока даже и кривые), посмотреть в разных жанрах/стилях, потом если есть возможность, все это переписать самому руками на инструментах, свести и пр.
Т.е. ты подсмотрел идею, дальше сам делай. Это хороший инструмент, и им глупо не пользоваться.
Именно этим. Генерациями готовыми к релизам, наиболее и интересен.
Сколько нужно всего пройти, чтобы получить, к примеру, такую финалку (случайно попалось). И, кстати, как душевненько..



А то что вспомогательно - подсмотреть идею, так это канеш кому-то может быть полезно.
Вот только после съёма, записи, сведения - по результату, это будет совсем другая история.
Поэтому, снова возвращаемся к наибольшей ценности генерации. Но её уязвимости по правам.

Ну или получи готовый трек, который 98% слушателей даже не отличат от "живого" человека (да им и честно говоря вообще пофиг на чем и кем это сделано). Вопрос морали это не про современную музыку, да и не музыку тоже.
Так по поводу морали - это вообще не к производителям. Во все времена. И уж тем более, музыкальной продукции.
А вот потребители, напротив - моралью озабочены. Как правило, им не плевать - их дурят или нет.
В США вон активно рассуждают о ценности ии-групп типа The Velvet Sundown в принципе.
Их треки кстати Spotify не удалили, потому что те успели заявить, что они - ии-генерации.
 
  • Like
Реакции: Mike Deblin
Типа "мы тут написали с ИИ суперхит, в котором использовали 5 секунд Вашего риффа, вот вам многа денях и наше почтение"
Вот прям обидно стало ))) Я как раз примерно таким в Суно и занимаюсь, и да, 99,5% работы делает ИИ.
Прямо холодный душ.
Глупо все это выглядит со стороны. Закинул отрывок, нажал кнопку, повторил, что-то указал, нажал кнопку, повторил и т.д.
Получил результат, сиди радуйся что ты "творец" =)))


Думаю через некоторое время произойдет перенасыщение, как происходит сейчас с картинками и видео, которые уже вызывают в лучшем случае зевоту и ценность такого контента упадет до нуля.
 
  • beer
Реакции: Sharu

Сейчас просматривают