Музыкальный вайбкодинг (7 онлайн)

sorry за прямоту, но вы просто не в зуб ногой в теме
вы тут не первый хейтер, тоже извините за прямоту, просто не интересно вашими страхами и переживаниями на тему профессии заниматься и вести диалог на эти темы )
 
она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.
Сам столкнулся с подобным, когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA.
 
когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA
Предположим собрал. А доработать? А поменять алгоритмы? Попробовать разные?
Слишком быстро нейросетки развиваются. Ну вот навскидку, экспресс:

Для точного VST3 копирования LA-2A на JUCE есть несколько подходов:

  1. Opto-эмуляция через моделирование CdS фоторезистора — самый важный компонент. Его сопротивление меняется нелинейно и с гистерезисом. Моделируют через RC-цепочку с переменным сопротивлением (LDR — Light Dependent Resistor). Ключевые параметры: время включения/выключения ~10-15ms / 60-150ms (зависит от глубины компрессии), память эффекта (hysteresis).
  2. Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
  3. State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
  4. Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза, наложенный сатурационный clipper на выходе (имитация трансформатора и ламп).
Рекомендация: для максимального сходства — гибрид: opto-ячейка через физическую модель LDR (решение диффура с переменным сопротивлением) + WDF или wave digital модель лампового усилителя на выходе. В JUCE готовые классы в dsp модуле не помогут — придётся писать самому.


ну уровне промптов можно детальнейшим образом вмешиваться в куски кода и их модифицировать на своё усмотрение, при этом никакого геморроя.
а если какой-то алгоритм не до конца понятен, то можно попросить ИИ агента внести в файлы подробные комментарии на русском. он каждую строчку кода распишет... и так уже вручную будет легче внести какие-то правки.
 
Последнее редактирование:
  • Like
Реакции: belovw
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
 
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
я так понял года на 3. и это прямо пропасть ) поэтому можно смело браться за старое и снова попробовать, если есть интерес.
вот сходу рекомендую модель Big Picle в Open Code попробовать, это бесплатно и места не занимает. (как я понял погуглив, это свежее, оно на тестировании и через какое-то время перейдёт в платное)
 
Последнее редактирование:
не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну.
если просто с наскока спросить чат-бот (тем более если бесплатный), то скорее всего результат будет как спросить бабушку, или продавщицу кваса,
а для более специфических, серьёзных задач, нужно подход более серьёзный,
выбрать подходящую платную модель (желательно последих версий), создать проект, с нужной информацией (можно схемы, можно документацию, можно книжки по созданию DSP алгоритмов которые ИИ проработает), тогда можно ожидать более правильных ответов, как то так :rolleyes:
 
  • Like
Реакции: dugdum®
Зависимость от онлайн моделей — не Айс! В любой момент либо вырубят, либо что то поменяется.
Локальные модели требуют больших ресурсов, видеокарты, оперативки и.т.д... Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
Не совсем верный стереотип, что динозавры набирают 100500 строк кода ручками. Они же тоже не первый день замужем, там уже все настроено и воркфлоу и куча шаблонов, библиотек, своих наработок и.т.д... CTRL+С и CTRL+V кусками по 1000 строк, несколько правок и все готово.
 
тут есть еще проблема, вслучае какихто форсмажоров большая часть проектов на вайбкоде встанут, если "вайб кодеры" потеряют доступ к ИИшкам.
чтоб запустить и крутить локальную модель нужны большие ресурсы
 
Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
при таком сценарии, можно и ручками,
а вот если ручками день, а на следующий ещё продолжать, а с ИИ 2-3 часа ? :rolleyes:

ИИ это инструмент. можно пользоваться, для экономии времени, можно не пользоваться.
можно вручную винтики закручивать, даже при наличии электроотвертки.
 
  • Like
Реакции: АлександрSova
максимум что он может - это стырить.
это не так работае, как разтаки вы и не втеме. модель ничего не тырит впрямом смысле. она/оно на этом обучается и не хранит в базе
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
 
Opto-эмуляция через моделирование CdS фоторезистора
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.


Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
ии и добралась до остальных компонентов cхемы. да на триоды можно сделать мат модель (только не итеррациями), но проблема в том что она очень ресурсожручая и не оптимизируется. на 3 каскада примерно 800 умножений на семпл.

State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
5000 умножений на семпл. :)

Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза
ии вспомнила про динамическую конволюцию. в свое время focusrite делала такую. называлась она liquid channel кто помнит. как раз для описания поведений приборов динамической обработки. но проблема была в том что все это было очень ресурсоемко и даже при это весьма посредственно иммитировала звучания реальных компрессоров. поэтому была благополучно забыта.

ИТОГО: в отличие от эвалайзеров, которые могут быть достаточно неплохо смоделированы при помощи статической конволюции + перегиба переходной ха-ки (что позволяет сделать плагин который требует 10-15 умножений на семпл). более менее точное физмоделирование или просто моделирование динамической обработки требует построения очень ресурсоемких моделей, которые требуют тысячи MUL/FMA операций на семпл. то есть практически это не реализуемо. это знают все разработчики, которые реально пробовали это сделать.

ИТОГО: ии что то написал, а вы не поняли что. в результате полная идиллия. :)
 
я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе?
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу. Но печально другое - мало кто пока осознает (в экстазе доступности средств производства каждой домохозяйке) что конец приходит всему, потому что всё в мире тысячелетиями выстраивалось по другим законам. Так что да, сейчас практически каждый может создать свой "мини-майкрософт", или топовый "музыкальный проект", за 200 баксов в месяц, не имея представления о самой индустрии. Но самое неприятное в этом что все это ведет к таким последствиям, которые никто пока не в состоянии предсказать, поэтому расстраиваться только о потере работы или ценности инвестиций в собственное развитие и компетенцию - очень недальновидный подход)

Если кому-то многа букв, то смысл тирады в одной фразе:
"Все не так плохо - все гораздо хуже"
 
  • beer
  • Like
Реакции: Slick и dugdum®
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
 
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
 
  • Like
Реакции: dugdum® и evgeny26
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
ну если грубо, то так и работает наш мозг. мы не просто тырим а пересказываем интерпритируем
 
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу.
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
 
Если новые технологии создал человеческий мозг, то создаст и ИИ рано или поздно потому, что принцип работы один и тот же, разница на данном этапе только в архитектуре и реализации. И думающим людям давно страшновато от того что происходит... Но это оффтоп конечно...
 
  • Like
Реакции: euggie2000
ну если грубо, то так и работает наш мозг.
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
 
Последнее редактирование:
до чего дошел прогресс! :)


sorry за прямоту, но вы просто не в зуб ногой в теме, поэтому у вас и возникает ощущение, что там все сложнее чем "просто стырил".
я разными алгоритмами dsp давно занимаюсь и многие из них писал сам с нуля. не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну. :)

примерно так - есть спецы по dsp, которые могут написать библиотеку с нуля. их примерно 0.1%. и есть 99.9% просто приграммистов, которые максимум что могут - взять готовую библу и подключить ее в свой проект. именно это и делает ии. в лучшем случае. наверное круто навайбкодить эдитор. в ручную его писать долгое и нудное дело. но насчет алгоритмов - ии вообще ничего не знает о том как работает LA2A. маскимум - она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.

я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе? там ты хотя бы честно сам собираешь цепочку из стандартных эффектов. а тут что и где нашла ии вообще непонятно. такого Г на просторах и-нета валяется великое множество. ;)
Интересно было почитать комментарий реального производителя конечно. Собственно, вот и расставлены точки над ё, как по мне. По собственным ощущениям, в вайбкодинге чисто психологически появляется это ощущение «своё, домашнее оно же вкуснее», это интересно как процесс, как навыки на будущее, но как конечный продукт, учитывая уже перегруженный рынок профессионального качественного софта, такие цифровые поделия не стыдно использовать лишь самому, или паре друзей показать, дескать «сам». Но уровень ответственности реального производителя, продающего годами свой товар людям за их кровные, и домашних любопытствующих энтузиастов мягко говоря очень разный. Но опять же, прогресс, приходится один хер все это изучать..
 
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
Лично мне очень импонирует ваш оптимизм)
 
  • beer
Реакции: dugdum®
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
Вообще в современном мире (и рынке) уживаются многие артефакты прошлого с современными технологиями: виниловые пластинки с облачными сервисами, драматические театры с облачными сервисами, даже проститутки с облачными сервисами. Это все мило и внушает надежду, но только единственная аналогия меня нервирует: конь и двигатель внутреннего сгорания. Если ИИ - это ДВС, а наши профессии - это конь, то нам пздц
 
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
крутые дядьки пишут, что да. что звук LA2A или 1176 в софте никто так им не смог повторить. эаметьте, даже если сводят в компе, то вся динамика стоит рядом в стойке и народ замолачивается за то, чтобы выкинуть дорогу в аналог, пожать и ее и затянуть назад! аналоговых эквалайзеров (кроме мастерингистов) ни у кого нет, а вот вся динамика есть в оригинальных железках.

и тут все просто. обычный EQ со статической импульсной можно считать через FFT. это быстро и просто. а динамическую конволюцию (даже если ты создашь эпическую базу импульсных откликов) быстро посчитать не получится. если импульс у тебя 200 семплов то на круг получишь 200FMA операций на один входной семпл. если отклик 1000, то получишь 1000FMA операций и один входной канал на 48kHz положит твой компик на бок.

но можно извратиться и считать все на видеокарте. это конечно тот еще гемор, так как там расчет целочисленный и в 8/16 битный. но думаю на какой нибудь RTX1580 можно сделать онлайн расчет пары каналов очень точной физмодели LA2A. но сдается мне, что немного людей будут покупать для этого RTX1580. для игр и ии купят, а вот для моделей компрессоров - врядли. :)
 
Последнее редактирование:
но 1% на творчество все равно остается.
так ведь все идет к тому что мы делегируем созидание создание нового ИИ
у него пока нет желаний и стремлений но это вопрос 5-10 лет
мне жаль скептиков которые досих пор думают что это просто текстовая бд
 
Началось ))) про захват ии миром , я вот каждый день с gemini и клодом общаюсь , и они каждый день по моему все тупее и тупее :))
уже просто забил на релевантность и ржу )) ...

какой там скайнет , оно в трех соснах путается )) безнадежно )) ....

"ой простите , я я подставил данные из другой системы измерений , вы правы , метр это не фут " (с)....
 
  • Haha
Реакции: Zildjian
IMG_20260510_141953_122.jpg
 
  • Haha
Реакции: evgeny26
я разными алгоритмами dsp давно занимаюсь и многие из них писал сам с нуля. не так давно мучил гпт по поводу написания нескольких алгоритмов

Это один из самых интересных вопросов на стыке ИИ и инженерии.

Короткий ответ: LLM (как я) — нет, но другие виды ИИ — да.

Давайте разделим понятия. Если вы имеете в виду Чат-ботов (LLM), они не могут "изобрести" новый физический закон или принципиально новую математику, которой нет в их обучающей выборке. Они — "ремиксеры".

Но если говорить об ИИ в целом (Deep Learning, Genetic Algorithms, Reinforcement Learning), то да, они способны находить решения, которые человек не придумал бы.
Вот как это работает на практике в DSP:

1. Почему LLM (код-генераторы) не "изобретатели"​

Когда вы просите LLM написать компрессор, он генерирует код, основанный на паттернах, которые он видел в миллионах строк кода на GitHub.
  • Результат: Он напишет вам компрессор на базе RMS detector и VCA (умножение сигнала).
  • Почему: Потому что это стандартное решение. LLM не понимает физику звука, он понимает синтаксис DSP-кода. Он не может придумать новый математический оператор, которого не было в интернете.

2. Где ИИ действительно "изобретает" (Neural Synthesis)​

Здесь мы уходим от написания кода к поиску в латентном пространстве (Latent Space).
Пример: NSynth (Google) Исследователи обучили нейросеть на тысячах инструментов. Нейросеть создала внутреннее математическое пространство (латентное пространство), где "гитара" находится в одной координате, а "труба" в другой.
  • Изобретение: Если вы попросите ИИ сгенерировать звук в координатах между гитарой и трубой, он создаст звук, который физически не существует в природе. Это не эмуляция, это новый тип синтеза.
  • Применение к LA-2A: Вы можете попросить ИИ найти "пространство между LA-2A и Tube-Tech CL-1B" и придумать компрессию, которая имеет характеристики обоих, но является новой сущностью.

3. Генетические алгоритмы (Evolutionary DSP)​

Это самый мощный инструмент для "изобретения" новых алгоритмов.
  • Как это работает:
    1. Вы задаете целевой звук (например, идеальный LA-2A).
    2. Вы даете ИИ набор базовых DSP-блоков (фильтры, задержки, нелинейности).
    3. ИИ случайно соединяет эти блоки в схему.
    4. Он "прослушивает" результат, вычисляет ошибку (разницу с оригиналом).
    5. Лучшие схемы "скрещиваются" и мутируют.
  • Результат: Через 1000 поколений ИИ может придумать схему компрессии, которая использует, например, фазовую модуляцию задержки для управления огибающей, а не стандартное умножение. Человек бы никогда так не сделал, но это будет работать и звучать уникально.

4. Neural DSP как "черный ящик" (Black Box Algorithm)​

Когда мы используем нейросеть (LSTM/Transformer) для эмуляции, сама структура весов нейросети — это и есть новый алгоритм.
  • Он не использует формулы y=ax+by=ax+b.
  • Он использует матричные преобразования, которые математически эквивалентны сложнейшей системе дифференциальных уравнений, которую невозможно вывести на бумаге.
  • Это изобретение? Да. Это новый способ обработки данных, который ИИ вывел сам из примеров.

5. Пример "изобретения" ИИ в DSP​

Есть проект (например, от исследователей из Grame или Cycling '74), где ИИ генерирует формулы для эффектов.
  • Задача: Создать эффект "глитча".
  • Решение человека: Рандомная задержка (Random Delay).
  • Решение ИИ: ИИ может придумать алгоритм, который использует синусоиду от текущего сэмпла для управления частотой дискретизации (Sample Rate Modulation). Это звучит как глитч, но математически это совершенно новый подход.

Резюме: Сможет ли ИИ изобрести "Супер LA-2A"?​

Тип ИИСпособность изобретатьРезультат
LLM (Я)НетНапишет классический код на JUCE. Код будет рабочим, но стандартным.
Genetic AlgoДаМожет придумать странную топологию цепи, которая звучит как LA-2A, но работает по-другому.
Neural NetДаСоздаст "алгоритм", который не является формулой, а является обученной моделью (новое математическое пространство).

Вердикт: ИИ не напишет вам в чате: "Эй, я изобрел новый закон компрессии, используй эту формулу!".
Но ИИ может сгенерировать модель или код, который делает звук, который раньше был невозможен, путем комбинирования математических операций в конфигурацию, которую человек не предвидел.

Это называется "Computational Creativity" (Вычислительное творчество). В DSP оно уже существует.
 
тут есть еще проблема, вслучае какихто форсмажоров большая часть проектов на вайбкоде встанут, если "вайб кодеры" потеряют доступ к ИИшкам.
чтоб запустить и крутить локальную модель нужны большие ресурсы
С таким подходом можно ничем вообще не заниматься, потому что вдруг Луна на Землю завтра налетит )))
Есть альтернативные ИИ, есть локалки, много чего есть, найдут варианты.
Если проекты серьезные, то там и не дурачки занимаются, и без ИИ сядут код продолжат писать. Если новички, ну и не будет у них этой игрушки ИИ, сядут изучать ))
Короче, не усложняйте себе мировосприятие и свою жизнь всеми этими "если" ))
 
Спойлер: спросил ИИ насчёт придумывания новых алгоритмов

есть тема что пиздеть - не кирпичи ворочать. одно дела писать херню про скрещивание алгоритмов по формуле y=ax+by=ax+b. другое - написать что то реальное.

вообще ИИ может генерить очень убедительный псевдонаучный бред, в который начинает верить 99% лох неспециалистов. у меня супруга постоянно с ии беседует на разные темы. но даже она начинает понимать, что во многих случаях ии несет откровенную пургу. но очень убедительно несет. :)

ЗЫ: не смотря на то что мы не во всем специалисты, но стоит быть лохами.
 
Последнее редактирование:
  • Like
Реакции: Zildjian

Сейчас просматривают