Всё что нужно знать о Suno/Udio/etc (10 онлайн)

Someone Somewhere

New Member
30 Июн 2026
1
0
1
46
Для начала, то что сегодня все называют ИИ не является ИИ.

- так называемые "нейронные сети" не имеют никакого, ни малейшего отношения к человеческим нейронам
- так называемое "машинное обучение" не имеют никакого, ни малейшего отношения к тому как обучается человеческий мозг
- ИИ не "думает", он просто не умеет это делать, но имитирует и предугадывает
- компьютер не может "думать", он просто перемалывает 0 и 1, и это все что он делает!
(строго говоря никаких 0 и 1 тоже не существует, шок контент)

Да что там говорить, даже нет общепринятого термина что такое ИИ. поэтому обращаться в суд бессмысленно.
Вы можете взять обычный калькулятор и назвать его ИИ — и никаких судебных исков не последует.
это реклама и маркетинг.
всякоразные сэмы альтманы жмут педаль в пол, потому что у них нет выбора.
Но это тема для отдельного разговора.

Итак, SUNO (как и любой другой генеративный так называемый "ИИ") -- это просто инструмент.
типа как синтезатор.
Он одновременно очень продвинутый, но и одновременно странный, сломанный "синтезатор".

Suno/Udio/etc не даёт результата совместного звучания разных инструментов и голосов, а лишь акустический результат, ВЫДАЮЩИЙ себя за песню.
Простое следствие из того, что я сказал: не будет "чистых" стемов (как обычно их понимают), это в принципе невозможно (для любой генеративной аудио/нейросети).

Suno/udio/riffusion AI, как и любой другой генеративный ИИ, создает песни (зачеркнуто), генерирует звук токен за токеном, шаг за шагом, байт за байтом (то есть компьютерный байт).
Он не понимает инструменты, многодорожечную запись, микширование, мастеринг, искажение, эквалайзер, компрессию и любые другие традиционные методы производства.
Для ИИ песня — это всего лишь единый поток звука — просто байты, представляющие частоту, длительность и скорость.

LLM -- Большая языковая модель, которая использует предиктивную математику для определения следующего наилучшего слова в цепочке слов, которые она объединяет, чтобы предоставить связный ответ на вашу подсказку.
Реальность такова, что LLM был ОБУЧЕН звучать как человек, а не думать как человек.
Он не думает. Он не знает. Он не осознаёт. Он не осознаёт, что вы его о чём-то спросили, и он не осознаёт, что отвечает.
Вот и всё!
Это просто -- да, очень впечатляющий код.
Сложный вывод не является доказательством мысли, это всего лишь статистические отголоски человеческого мышления.

Надеюсь, это понимание кому-то поможет.

ps. и не будет никакой версии #100 чат GPT/LLM которая всех заменит.
На этой архитектуре не ждите, этого не будет )

pps. однако, с другой стороны, человек все-таки изобрел атомную бомбу, хотя это было невозможно (как выяснилось -- почти невозможно).
поэтому, я не исключаю того, что прямо сейчас где-то работают серьезные люди над проблемой реального ИИ (как сейчас говорят -- общего ИИ).
и возможно, они его изобретут, лет через 100 (это моя аналитика с моего дивана).
и вот тогда-то у человечества появятся реальные, а не придуманные, проблемы.

пока все проблемы от уверовавших в ИИ, в том числе и руководителей/менеджеров, которые начинают увольнять людей (правда пошла и обратка).
 
Для начала, то что сегодня все называют ИИ не является ИИ.

1. «То, что сегодня все называют ИИ, не является ИИ»​

Это утверждение не соответствует действительности. Искусственный интеллект — это устоявшийся научный и юридический термин.

  • Официальное определение: В российском законодательстве ИИ определяется как «любая система данных, программное обеспечение или аппаратное средство, обладающее способностью обрабатывать данные и информацию способом, напоминающим разумное поведение». Также существует определение ИИ как «технологии, основанной на наборе методов для решения когнитивных задач, способной действовать с разной степенью автономности».
  • Научный контекст: Современные нейросети и системы машинного обучения — это признанные направления исследований в области ИИ. Утверждение, что «это не ИИ», противоречит как академическому консенсусу, так и нормативным актам.

2. «Нейронные сети не имеют никакого отношения к человеческим нейронам»​

Это утверждение частично верно, но преподносится как абсолютная истина, что неверно.

  • Вдохновение, а не копия: Искусственные нейронные сети (ИНС) были созданы по биологическому принципу работы мозга. Они являются сильно упрощенной математической моделью, но само название и архитектура (нейроны, слои, синапсы) напрямую заимствованы из нейробиологии.
  • Ключевые различия: Да, искусственные нейроны отличаются от биологических. В мозге нейронов значительно больше, они используют спайковую активность, а ключевой алгоритм обучения ИНС (обратное распространение ошибки) в мозге, скорее всего, отсутствует. Однако это не опровергает, а подтверждает наличие связи — пусть и неидеальной.

3. «Машинное обучение не имеет отношения к тому, как обучается человеческий мозг»​

Аналогично предыдущему пункту, это преувеличение.

  • Обучение человека и машин имеет как сходства, так и различия. Например, люди могут учиться на одном примере, а ИИ-системам требуются тысячи.
  • Однако существуют и параллели: способность нейросетей к обучению «в контексте» (in-context learning) аналогична человеческой способности делать выводы из нескольких примеров. Более того, исследователи активно изучают сходства между «воспроизведением» (replay) в мозге млекопитающих и в искусственных нейросетях.

⚖️ 4. «Обращаться в суд бессмысленно, можно назвать калькулятор ИИ и исков не будет»​

Это самое опасное и абсолютно неверное утверждение.

  • Судебная практика существует: В России Верховный Суд впервые в истории проводит масштабное обобщение судебной практики по делам, связанным с использованием ИИ. Суды уже рассматривают иски о:
    • Возмещении вреда, причиненного решениями ИИ.
    • Защите чести, достоинства и деловой репутации при распространении сведений, созданных с помощью ИИ (включая дипфейки).
    • Нарушении интеллектуальной собственности при обучении ИИ без согласия автора.
  • Международные прецеденты: В Великобритании суд уже признал качество подготовки документов ИИ достаточным для ведения судебного разбирательства, а ИИ помог выиграть дело в суде.
  • Юридическая несостоятельность: Назвать калькулятор ИИ в суде невозможно, так как есть четкое законодательное определение ИИ (см. пункт 1). Суд будет опираться на него, а не на чьи-то субъективные заявления.

5. «Suno/Udio не даёт результата совместного звучания, а лишь акустический результат... не будет "чистых" стемов»​

Это утверждение категорически неверно и говорит о том, что автор не знаком с актуальным состоянием технологий (пост от 2026 года, а информация устарела как минимум на год).

  • Стемы существуют: Suno и Udio уже предоставляют возможность экспорта многодорожечных стемов.
    • Suno может экспортировать до 12 отдельных WAV-стемов, включая ведущий вокал, бэк-вокал, барабаны, бас и отдельные синтезаторные партии.
    • Udio позволяет скачивать стемы для вокала, барабанов, баса и «других» инструментов.
  • Качество: Современные модели используют «AI Re-generation» для создания стемов, что дает гораздо более чистый результат, чем старые методы. Хотя иногда могут быть артефакты, это решаемая проблема, и многие продюсеры успешно используют эти стемы в своих проектах.

6. «LLM не думает, не знает, не осознаёт»​

Это утверждение верно по сути, но преподносится как нечто, что делает LLM бесполезными, что не так.

  • Принцип работы: Да, большие языковые модели (LLM) работают на основе предсказания следующего токена (слова) в последовательности. Они не обладают сознанием или пониманием в человеческом смысле.
  • Но это не «просто код»: Обучение LLM — это процесс минимизации функции потерь путем корректировки миллиардов параметров. В результате модель не запоминает текст, а выявляет сложные закономерности в языке, логике и семантике, что позволяет ей генерировать связные и релевантные ответы. Сводить это к «просто статистическим отголоскам» — значит игнорировать всю сложность и практическую пользу технологии.

️ 7. «Не будет версии #100 ChatGPT, которая всех заменит»​

Это прогноз, а не факт, и он противоречит текущим трендам.

  • Развитие продолжается: Каждые несколько месяцев выходят новые, более мощные модели (GPT-4, GPT-5 и т.д.).
  • Интеграция в отрасли: Крупнейшие компании (например, мейджоры звукозаписи, как Sony, Universal, Warner) ведут переговоры с Suno и Udio о лицензировании своих каталогов для обучения ИИ. Это говорит о том, что индустрия видит в ИИ не сиюминутную «игрушку», а долгосрочный инструмент, который будет развиваться и дальше.

Итог​

Тема содержит множество фактических ошибок, особенно в части, касающейся юридического статуса ИИ и технических возможностей современных генеративных моделей (Suno, Udio). Автор путает философские вопросы о сознании (где он отчасти прав) с юридическими и технологическими реалиями (где он ошибается практически во всем).

Сегодня ИИ — это четко определяемая технологическая и юридическая категория, а генеративные музыкальные модели достигли уровня, позволяющего профессионально работать с их результатами, включая разделение на отдельные дорожки (стемы).
 
  • Like
Реакции: Vladiger и Andruha
Основная проблема позиции пользователя заключается в редукционизме — попытке упростить сложнейшие системные процессы до примитивных физических или математических составляющих, игнорируя эмерджентные свойства (свойства, возникающие в системе из-за сложности взаимодействий).

1. Довод: «Нейронные сети не имеют никакого отношения к человеческим нейронам»
Критика: Это утверждение фактически неверно с точки зрения истории и архитектуры развития технологий.

Проверенный факт: Современное глубокое обучение (Deep Learning) базируется на коннекционизме. Концепция искусственных нейронных сетей напрямую заимствовала структуру биологического нейрона: входные сигналы, функция активации (аналог потенциала действия) и веса связей (аналог синаптической пластичности).

Пример: Архитектуры CNN (сверточные нейросети), используемые для распознавания лиц, были вдохновлены работой зрительной коры головного мозга (модель Хьюбела и Визеля). Говорить, что они «не имеют отношения» к биологии — значит отрицать саму основу их проектирования.

2. Довод: «Машинное обучение не имеет отношения к тому, как обучается человеческий мозг»
Критика: Это утверждение игнорирует фундаментальные принципы обучения в обеих системах.

Проверенный факт: Оба процесса основаны на коррекции ошибок и усилении полезных сигналов. Метод обратного распространения ошибки (Backpropagation), лежащий в основе обучения почти всех современных ИИ, является математическим приближением того, как мозг корректирует связи между нейронами.

Пример: Принципы «обучения с подкреплением» (Reinforcement Learning) — это прямой аналог системы дофаминового вознаграждения в человеческом мозге: агент совершает действие, получает сигнал (награда или штраф) и корректирует свои веса. Это прямая попытка имитировать биологический механизм обучения.

3. Довод: «ИИ не "думает", он просто имитирует... компьютер только перемалывает 0 и 1»
Критика: Это логическая ловушка (аргумент к составу). Если мы применим этот же критерий к человеку, то человеческий мозг — это лишь «перемалывание» химических сигналов и электрических импульсов.

Проверенный факт: В науке существует понятие функционализма. Если система способна решать задачи, требующие высокого уровня абстракции (диагностика болезней, написание кода на сложных языках, решение математических теорем), то разница между «имитацией» и «мышлением» становится чисто семантической.

Пример: Исследования показывают эмерджентные способности LLM. Модели, обучавшиеся лишь предсказывать следующее слово, внезапно начали демонстрировать способности к логическому выводу (Reasoning) и теории разума (Theory of Mind), которые не были заложены в них напрямую программным кодом.

4. Довод: «Нет общепринятого термина... это просто реклама и маркетинг»
Критика: Это попытка обесценить научную дисциплину из-за отсутствия единого слова для "сознания".

Проверенный факт: В академической среде существуют строгие определения. Например, Narrow AI (Узкий ИИ) — системы, решающие конкретные задачи; и AGI (Общий ИИ) — гипотетическая система с универсальными способностями.

Пример: Существуют международные стандарты (например, ISO/IEC), которые классифицируют системы искусственного интеллекта по их функциональным возможностям. Маркетинг может преувеличивать текущие возможности, но это не делает саму технологию «маркетингом».

5. Довод: «Suno/Udio выдают "сломанный" звук, потому что они не понимают инструменты»
Критика: Пользователь путает метод представления данных с отсутствием понимания структуры.

Проверенный факт: Нейросети используют латентные пространства. Чтобы генерировать музыку, которые звучит как «песня», модель должна выстроить внутреннюю математическую карту того, как инструменты взаимодействуют друг с другом (частоты, тембры, ритмические паттерны).

Пример: Если бы нейросеть не «понимала» структуру музыки на глубоком статистическом уровне, она выдавала бы белый шум. То, что мы воспринимаем как «сломанный звук», — это артефакты сжатия и генерации (диффузионные ошибки), а не отсутствие знания о том, что такое гитара или вокал.

6. Довод: «На этой архитектуре [LLM] не будет версии #100, которая всех заменит»
Критика: Это утверждение противоречит Закону масштабирования (Scaling Laws).

Проверенный факт: Исследования OpenAI и Anthropic доказали, что при увеличении количества параметров, объема данных и вычислительной мощности возможности моделей растут нелинейно.

Пример: Каждая новая итерация (от GPT-3 к GPT-4) демонстрировала качественный скачок в способностях к логике и пониманию контекста. Утверждение о том, что архитектура «забуксует», не имеет доказательств, так как мы еще даже не достигли пределов текущих вычислительных мощностей человечества.

7. Довод: «Реальный ИИ изобретут через 100 лет»
Критика: Это субъективное предположение, лишенное фактологической базы.

Проверенный факт: Скорость прогресса в области нейросетей за последние 10 лет превысила любые исторические прогнозы. Многие эксперты (например, из Google DeepMind) считают, что мы находимся на пути к AGI гораздо быстрее, чем ожидалось. Срок в 100 лет — это попытка защититься от страха перед технологическим прогрессом, а не научный прогноз.

Итог критики:
Пользователь совершает типичную ошибку «ошибки масштаба»: он видит отдельные кирпичи (нули и единицы, вероятности слов) и делает вывод, что из них невозможно построить здание (интеллект).
Однако история технологий показывает, что сложность системы порождает новые качества, которые невозможно предсказать, просто изучая её базовые компоненты.
 
  • Like
Реакции: Vladiger
Маркетинг от суно это )
Главный посыл - суно это инструмент, как синтезатор
 
возможно это тема-провокация, вброс ИИ агента
Да, вроде человеком написано, может нейронку слегка переформатировал, очеловечил. Есть острота текста, присущие человеческому мышлению ход (у машин он слишком логичный и правильный, сухой очень), а здесь видно как без понимания сути предмета, речь уходит в смысл, который связывают псевдорассуждениями.

Он не понимает инструменты, многодорожечную запись, микширование, мастеринг, искажение, эквалайзер, компрессию и любые другие традиционные методы производства.
Понимает. Можно указать эти переменные в промте и они могут быть использованы. Другой момент, что это не жесткие команды в логике "только так", а скорее набор модальностей "желательно", "предпочтительно". И так происходит тоже не просто так, а из-за множества переменных (текст, стиль, настроение, атмосфера, сама аранжировка и еще что может). До конца возможности этих нейронок не исследованы, а люди могут поспешить сделать выводы на основании как раз неумения пользоваться этим.
 

Сейчас просматривают