Музыкальный вайбкодинг (1 онлайн

я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе?
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу. Но печально другое - мало кто пока осознает (в экстазе доступности средств производства каждой домохозяйке) что конец приходит всему, потому что всё в мире тысячелетиями выстраивалось по другим законам. Так что да, сейчас практически каждый может создать свой "мини-майкрософт", или топовый "музыкальный проект", за 200 баксов в месяц, не имея представления о самой индустрии. Но самое неприятное в этом что все это ведет к таким последствиям, которые никто пока не в состоянии предсказать, поэтому расстраиваться только о потере работы или ценности инвестиций в собственное развитие и компетенцию - очень недальновидный подход)

Если кому-то многа букв, то смысл тирады в одной фразе:
"Все не так плохо - все гораздо хуже"
 
  • Like
  • beer
Реакции: Antonio, Slick и dugdum®
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
 
  • Like
Реакции: Greev
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
 
  • Like
Реакции: dugdum® и evgeny26
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
ну если грубо, то так и работает наш мозг. мы не просто тырим а пересказываем интерпритируем
 
  • Like
Реакции: Antonio
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу.
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
 
Если новые технологии создал человеческий мозг, то создаст и ИИ рано или поздно потому, что принцип работы один и тот же, разница на данном этапе только в архитектуре и реализации. И думающим людям давно страшновато от того что происходит... Но это оффтоп конечно...
 
  • Like
Реакции: Antonio и euggie2000
ну если грубо, то так и работает наш мозг.
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
 
Последнее редактирование:
  • Like
Реакции: Greev
до чего дошел прогресс! :)


sorry за прямоту, но вы просто не в зуб ногой в теме, поэтому у вас и возникает ощущение, что там все сложнее чем "просто стырил".
я разными алгоритмами dsp давно занимаюсь и многие из них писал сам с нуля. не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну. :)

примерно так - есть спецы по dsp, которые могут написать библиотеку с нуля. их примерно 0.1%. и есть 99.9% просто приграммистов, которые максимум что могут - взять готовую библу и подключить ее в свой проект. именно это и делает ии. в лучшем случае. наверное круто навайбкодить эдитор. в ручную его писать долгое и нудное дело. но насчет алгоритмов - ии вообще ничего не знает о том как работает LA2A. маскимум - она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.

я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе? там ты хотя бы честно сам собираешь цепочку из стандартных эффектов. а тут что и где нашла ии вообще непонятно. такого Г на просторах и-нета валяется великое множество. ;)
Интересно было почитать комментарий реального производителя конечно. Собственно, вот и расставлены точки над ё, как по мне. По собственным ощущениям, в вайбкодинге чисто психологически появляется это ощущение «своё, домашнее оно же вкуснее», это интересно как процесс, как навыки на будущее, но как конечный продукт, учитывая уже перегруженный рынок профессионального качественного софта, такие цифровые поделия не стыдно использовать лишь самому, или паре друзей показать, дескать «сам». Но уровень ответственности реального производителя, продающего годами свой товар людям за их кровные, и домашних любопытствующих энтузиастов мягко говоря очень разный. Но опять же, прогресс, приходится один хер все это изучать..
 
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
Лично мне очень импонирует ваш оптимизм)
 
  • Like
  • beer
Реакции: Antonio и dugdum®
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
Вообще в современном мире (и рынке) уживаются многие артефакты прошлого с современными технологиями: виниловые пластинки с облачными сервисами, драматические театры с облачными сервисами, даже проститутки с облачными сервисами. Это все мило и внушает надежду, но только единственная аналогия меня нервирует: конь и двигатель внутреннего сгорания. Если ИИ - это ДВС, а наши профессии - это конь, то нам пздц
 
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
крутые дядьки пишут, что да. что звук LA2A или 1176 в софте никто так им не смог повторить. эаметьте, даже если сводят в компе, то вся динамика стоит рядом в стойке и народ замолачивается за то, чтобы выкинуть дорогу в аналог, пожать и ее и затянуть назад! аналоговых эквалайзеров (кроме мастерингистов) ни у кого нет, а вот вся динамика есть в оригинальных железках.

и тут все просто. обычный EQ со статической импульсной можно считать через FFT. это быстро и просто. а динамическую конволюцию (даже если ты создашь эпическую базу импульсных откликов) быстро посчитать не получится. если импульс у тебя 200 семплов то на круг получишь 200FMA операций на один входной семпл. если отклик 1000, то получишь 1000FMA операций и один входной канал на 48kHz положит твой компик на бок.

но можно извратиться и считать все на видеокарте. это конечно тот еще гемор, так как там расчет целочисленный и в 8/16 битный. но думаю на какой нибудь RTX1580 можно сделать онлайн расчет пары каналов очень точной физмодели LA2A. но сдается мне, что немного людей будут покупать для этого RTX1580. для игр и ии купят, а вот для моделей компрессоров - врядли. :)
 
Последнее редактирование:
  • Like
Реакции: Greev
но 1% на творчество все равно остается.
так ведь все идет к тому что мы делегируем созидание создание нового ИИ
у него пока нет желаний и стремлений но это вопрос 5-10 лет
мне жаль скептиков которые досих пор думают что это просто текстовая бд
 
Началось ))) про захват ии миром , я вот каждый день с gemini и клодом общаюсь , и они каждый день по моему все тупее и тупее :))
уже просто забил на релевантность и ржу )) ...

какой там скайнет , оно в трех соснах путается )) безнадежно )) ....

"ой простите , я я подставил данные из другой системы измерений , вы правы , метр это не фут " (с)....
 
  • Haha
  • Like
Реакции: Greev и Zildjian
IMG_20260510_141953_122.jpg
 
  • Haha
Реакции: Greev и evgeny26
я разными алгоритмами dsp давно занимаюсь и многие из них писал сам с нуля. не так давно мучил гпт по поводу написания нескольких алгоритмов

Это один из самых интересных вопросов на стыке ИИ и инженерии.

Короткий ответ: LLM (как я) — нет, но другие виды ИИ — да.

Давайте разделим понятия. Если вы имеете в виду Чат-ботов (LLM), они не могут "изобрести" новый физический закон или принципиально новую математику, которой нет в их обучающей выборке. Они — "ремиксеры".

Но если говорить об ИИ в целом (Deep Learning, Genetic Algorithms, Reinforcement Learning), то да, они способны находить решения, которые человек не придумал бы.
Вот как это работает на практике в DSP:

1. Почему LLM (код-генераторы) не "изобретатели"​

Когда вы просите LLM написать компрессор, он генерирует код, основанный на паттернах, которые он видел в миллионах строк кода на GitHub.
  • Результат: Он напишет вам компрессор на базе RMS detector и VCA (умножение сигнала).
  • Почему: Потому что это стандартное решение. LLM не понимает физику звука, он понимает синтаксис DSP-кода. Он не может придумать новый математический оператор, которого не было в интернете.

2. Где ИИ действительно "изобретает" (Neural Synthesis)​

Здесь мы уходим от написания кода к поиску в латентном пространстве (Latent Space).
Пример: NSynth (Google) Исследователи обучили нейросеть на тысячах инструментов. Нейросеть создала внутреннее математическое пространство (латентное пространство), где "гитара" находится в одной координате, а "труба" в другой.
  • Изобретение: Если вы попросите ИИ сгенерировать звук в координатах между гитарой и трубой, он создаст звук, который физически не существует в природе. Это не эмуляция, это новый тип синтеза.
  • Применение к LA-2A: Вы можете попросить ИИ найти "пространство между LA-2A и Tube-Tech CL-1B" и придумать компрессию, которая имеет характеристики обоих, но является новой сущностью.

3. Генетические алгоритмы (Evolutionary DSP)​

Это самый мощный инструмент для "изобретения" новых алгоритмов.
  • Как это работает:
    1. Вы задаете целевой звук (например, идеальный LA-2A).
    2. Вы даете ИИ набор базовых DSP-блоков (фильтры, задержки, нелинейности).
    3. ИИ случайно соединяет эти блоки в схему.
    4. Он "прослушивает" результат, вычисляет ошибку (разницу с оригиналом).
    5. Лучшие схемы "скрещиваются" и мутируют.
  • Результат: Через 1000 поколений ИИ может придумать схему компрессии, которая использует, например, фазовую модуляцию задержки для управления огибающей, а не стандартное умножение. Человек бы никогда так не сделал, но это будет работать и звучать уникально.

4. Neural DSP как "черный ящик" (Black Box Algorithm)​

Когда мы используем нейросеть (LSTM/Transformer) для эмуляции, сама структура весов нейросети — это и есть новый алгоритм.
  • Он не использует формулы y=ax+by=ax+b.
  • Он использует матричные преобразования, которые математически эквивалентны сложнейшей системе дифференциальных уравнений, которую невозможно вывести на бумаге.
  • Это изобретение? Да. Это новый способ обработки данных, который ИИ вывел сам из примеров.

5. Пример "изобретения" ИИ в DSP​

Есть проект (например, от исследователей из Grame или Cycling '74), где ИИ генерирует формулы для эффектов.
  • Задача: Создать эффект "глитча".
  • Решение человека: Рандомная задержка (Random Delay).
  • Решение ИИ: ИИ может придумать алгоритм, который использует синусоиду от текущего сэмпла для управления частотой дискретизации (Sample Rate Modulation). Это звучит как глитч, но математически это совершенно новый подход.

Резюме: Сможет ли ИИ изобрести "Супер LA-2A"?​

Тип ИИСпособность изобретатьРезультат
LLM (Я)НетНапишет классический код на JUCE. Код будет рабочим, но стандартным.
Genetic AlgoДаМожет придумать странную топологию цепи, которая звучит как LA-2A, но работает по-другому.
Neural NetДаСоздаст "алгоритм", который не является формулой, а является обученной моделью (новое математическое пространство).

Вердикт: ИИ не напишет вам в чате: "Эй, я изобрел новый закон компрессии, используй эту формулу!".
Но ИИ может сгенерировать модель или код, который делает звук, который раньше был невозможен, путем комбинирования математических операций в конфигурацию, которую человек не предвидел.

Это называется "Computational Creativity" (Вычислительное творчество). В DSP оно уже существует.
 
Спойлер: спросил ИИ насчёт придумывания новых алгоритмов

есть тема что пиздеть - не кирпичи ворочать. одно дела писать херню про скрещивание алгоритмов по формуле y=ax+by=ax+b. другое - написать что то реальное.

вообще ИИ может генерить очень убедительный псевдонаучный бред, в который начинает верить 99% лох неспециалистов. у меня супруга постоянно с ии беседует на разные темы. но даже она начинает понимать, что во многих случаях ии несет откровенную пургу. но очень убедительно несет. :)

ЗЫ: не смотря на то что мы не во всем специалисты, но стоит быть лохами.
 
Последнее редактирование:
Товарищи, если вы в код не лезете вообще, почему сразу на чистом VST_SDK без обертки не пинаете клода генерировать исходники?
 
  • interesting
  • Like
Реакции: Vladiger и Greev
Создал сервис для изменения аудио nanosound.ru, измененное аудио можно скачать. Такое в принципе интересно использовать звукорежиссерам и всем тем, кто работает со звуком?
 
Товарищи, если вы в код не лезете вообще, почему сразу на чистом VST_SDK без обертки не пинаете клода генерировать исходники?
Так там соображать нужно, а клоду сказал хочу LA-2A, и сразу кайф, за 2 часа. А за неделю весь пакет от вейвс.
 
но можно извратиться и считать все на видеокарте. это конечно тот еще гемор, так как там расчет целочисленный и в 8/16 битный. но думаю на какой нибудь RTX1580 можно сделать онлайн расчет пары каналов очень точной физмодели LA2A. но сдается мне, что немного людей будут покупать для этого RTX1580. для игр и ии купят, а вот для моделей компрессоров - врядли.
GPU еще как считают в fp, еще лучше чем cpu и их производительность измеряется flops'ами, например последний у nvdia - rtx 5090, имеет производительность 104.9 Tflops в FP32, а в FP64 (double) уже на 2 порядка меньше!
 
@Vladiger, та не думаю, чтобы ИИ не справился. Я просто исхожу из того, что к примеру вдруг кто-то сильно увлечется и со временем докрутит свой проект до того состояния, что можно будет его на продажу выставить и очень хорошо если на тот момент окажется, что плагин написан не на коммерческом Juce за который платить нужно, а на штайнберговском SDK у которого сейчас лицензия MIT.
 
проект до того состояния, что можно будет его на продажу выставить и очень хорошо если на тот момент окажется, что плагин написан не на коммерческом Juce за который платить нужно, а на штайнберговском SDK у которого сейчас лицензия MIT.
Лично я на продажу ничего не планирую, но если алгоритм готов, то нет сложностей избавиться от Juce, дело техники, с помощью той же нейронки. Почему я начал делать для Juce? Да просто это было первой идеей, просто слышал что для этого есть Juce )
 
Я просто исхожу из того, что к примеру вдруг кто-то сильно увлечется и со временем докрутит свой проект до того состояния, что можно будет его на продажу выставить и очень хорошо если на тот момент окажется, что плагин написан не на коммерческом Juce за который платить нужно, а на штайнберговском SDK у которого сейчас лицензия MIT.
Juce вроде для инди-программистов-вайбкодистов бесплатно, если на плагинах до 50000$ заработать, а кто больше зарабатывает думаю не проблема и лицензию купить :D
 
  • Salut
Реакции: dugdum®
Juce для инди девелоперов до 40k вгод кабы бесплатен, смысл заморачиваться
ну если твои доходы с плагинов превышают 40k то уж 800уе можно заплатить
и это у тебя никто проверять не будет можешь на инди лицензии сидеть
 
Почему я начал делать для Juce? Да просто это было первой идеей, просто слышал что для этого есть Juce )
У меня что то подобное было, когда на какое то время увлекся игрушками.
Тоже, нагуглил, что для этого есть игровые движки Ogre, Irrlicht Engine (бесплатные) или Unity, Unreal engine (платные). Начал с бесплатных, разные движки, первые демки... Потом что то озадачился, попробовал прямое взаимодействие C++ и DirectX SDK и перестал понимать, а зачем игровые движки вообще. Ну бери да пиши на DirectX SDK свой движек, так как тебе нужно и что тебе нужно. А если это не 3D игра, а какая нибудь казуалка, так там вообще больше половины всего лишнего. Можно вообще и без DirectX писать.

Но в Юнити, к примеру, там оболочка, можно какие то сцены в редакторе конструировать, а в коде только взаимодествие с ними описывать. Это подкупает.
 
Чет я прошлёпил этот момент, не посмотрел на строку "Up to..." в таблице прайсов джуса
 
@Vladiger, да чем плох этот фреймворк? просто библиотека, файлы dll маленькие получаются, код эффективный, если оттуда функции использовать. Не вижу никаких минусов.
 

Сейчас просматривают