Я последние несколько недель пробую использовать набирающие огромную популярность text-to-image сервисы, которые создают изображения по текстовому описанию. Их несколько (DALL·E, MidJorney), лично мне нравится MidJorney. Я начал их смотреть потому что идея интересная, заодно решил посмотреть насколько хорошо они работают, скажем, для рисования песенных заставок для YouTube. Я пока ничего хорошего нарисовать не смог, но в их пабликах видел очень интересные работы, можно сказать мастерские! Кроме сервисов "текст->картинка" появились программы еще более высокого уровня, который создает видео по описанию (text-to-video)! Понятно, что пока это довольно примитивные модели, но они развиваются с очень большой скоростью.
Не трудно догадаться, что скоро появятся AI сервисы, которые будут работать по принципу text-to-music. Задаешь описания типа: "энергичный рок с ударными из кастрюль и соло на бензопиле" или "лирическая инструментальная баллада в размере 7/8 и темпе 123 bpm с соло горловым пением в сопровождении диксиленда" и AI выдает тебе сочинение. Если почитать, что люди просят нарисовать на text-to-image платформах - данные примеры не покажутся преувеличением
Я уверен, что лет через 10-15 эти технологии начнут выдавать музыкальный материал на уровне, который будет приемлем для значительной части слушателей музыки и плотно войдут в коммерцию и личную жизнь людей. Что можно ожидать?
Не трудно догадаться, что скоро появятся AI сервисы, которые будут работать по принципу text-to-music. Задаешь описания типа: "энергичный рок с ударными из кастрюль и соло на бензопиле" или "лирическая инструментальная баллада в размере 7/8 и темпе 123 bpm с соло горловым пением в сопровождении диксиленда" и AI выдает тебе сочинение. Если почитать, что люди просят нарисовать на text-to-image платформах - данные примеры не покажутся преувеличением
Я уверен, что лет через 10-15 эти технологии начнут выдавать музыкальный материал на уровне, который будет приемлем для значительной части слушателей музыки и плотно войдут в коммерцию и личную жизнь людей. Что можно ожидать?
- Большая часть коммерческой фоновой и прикладной музыки будет писаться автоматически на основе маркетинговых требований заказчиков (музыка для магазинов, рекламы, технических и обучающих видео и так далее).
- Большое количество любительских видео будет оформлены музыкальным материалом по описанию пользователей ("хочу красивый медляк типа XYX").
- Телефоны или видео сервисы будут автоматически подбирать или создавать музыкальный бакгроунд для видео и фото массовой публики используя автоматическое распознавание видео и фото контента.
- Часть населения подсядет на персонализированный музыкальный контент, когда плейлисты буду генерироваться под вкус конкретного слушателя. Захотел поработать под приятный музыкальный фон, описал настроение и стиль и получил свой персональный стрим.
- Появится новая и достаточно востребованная профессия - "Генератор AI контента." По типу веб-дизайнеров лет 20 назад, где народ примется работать над заказами, руля этим AI сервисами лучше чем, Вася с улицы. Заработки будут копеечные, но желающих заработать - масса.
- Эта технология начнет выполнять типовые музыкальные заказы обычных людей типа музыки для детских выступлений и праздников, поздравлений, конкурсных выступлений школьного и детсадовского уровня, музыку для спортивных номеров и так далее.
- Судя по всему, начнется проблема с авторскими правами на наиболее интересные AI работы. Кто является автором хита - человек, придумавший описание клевой музыки или разработчики AI алгоритма, который сочинил и озвучил эту идею? Эта проблема уже появилась с изображениями.
Последнее редактирование: