Музыкальный вайбкодинг (18 онлайн)

sorry за прямоту, но вы просто не в зуб ногой в теме
вы тут не первый хейтер, тоже извините за прямоту, просто не интересно вашими страхами и переживаниями на тему профессии заниматься и вести диалог на эти темы )
 
она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.
Сам столкнулся с подобным, когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA.
 
когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA
Предположим собрал. А доработать? А поменять алгоритмы? Попробовать разные?
Слишком быстро нейросетки развиваются. Ну вот навскидку, экспресс:

Для точного VST3 копирования LA-2A на JUCE есть несколько подходов:

  1. Opto-эмуляция через моделирование CdS фоторезистора — самый важный компонент. Его сопротивление меняется нелинейно и с гистерезисом. Моделируют через RC-цепочку с переменным сопротивлением (LDR — Light Dependent Resistor). Ключевые параметры: время включения/выключения ~10-15ms / 60-150ms (зависит от глубины компрессии), память эффекта (hysteresis).
  2. Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
  3. State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
  4. Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза, наложенный сатурационный clipper на выходе (имитация трансформатора и ламп).
Рекомендация: для максимального сходства — гибрид: opto-ячейка через физическую модель LDR (решение диффура с переменным сопротивлением) + WDF или wave digital модель лампового усилителя на выходе. В JUCE готовые классы в dsp модуле не помогут — придётся писать самому.


ну уровне промптов можно детальнейшим образом вмешиваться в куски кода и их модифицировать на своё усмотрение, при этом никакого геморроя.
а если какой-то алгоритм не до конца понятен, то можно попросить ИИ агента внести в файлы подробные комментарии на русском. он каждую строчку кода распишет... и так уже вручную будет легче внести какие-то правки.
 
Последнее редактирование:
  • Like
Реакции: belovw
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
 
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
я так понял года на 3. и это прямо пропасть ) поэтому можно смело браться за старое и снова попробовать, если есть интерес.
вот сходу рекомендую модель Big Picle в Open Code попробовать, это бесплатно и места не занимает. (как я понял погуглив, это свежее, оно на тестировании и через какое-то время перейдёт в платное)
 
Последнее редактирование:
не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну.
если просто с наскока спросить чат-бот (тем более если бесплатный), то скорее всего результат будет как спросить бабушку, или продавщицу кваса,
а для более специфических, серьёзных задач, нужно подход более серьёзный,
выбрать подходящую платную модель (желательно последих версий), создать проект, с нужной информацией (можно схемы, можно документацию, можно книжки по созданию DSP алгоритмов которые ИИ проработает), тогда можно ожидать более правильных ответов, как то так :rolleyes:
 
  • Like
Реакции: dugdum®
Зависимость от онлайн моделей — не Айс! В любой момент либо вырубят, либо что то поменяется.
Локальные модели требуют больших ресурсов, видеокарты, оперативки и.т.д... Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
Не совсем верный стереотип, что динозавры набирают 100500 строк кода ручками. Они же тоже не первый день замужем, там уже все настроено и воркфлоу и куча шаблонов, библиотек, своих наработок и.т.д... CTRL+С и CTRL+V кусками по 1000 строк, несколько правок и все готово.
 
тут есть еще проблема, вслучае какихто форсмажоров большая часть проектов на вайбкоде встанут, если "вайб кодеры" потеряют доступ к ИИшкам.
чтоб запустить и крутить локальную модель нужны большие ресурсы
 
Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
при таком сценарии, можно и ручками,
а вот если ручками день, а на следующий ещё продолжать, а с ИИ 2-3 часа ? :rolleyes:

ИИ это инструмент. можно пользоваться, для экономии времени, можно не пользоваться.
можно вручную винтики закручивать, даже при наличии электроотвертки.
 
максимум что он может - это стырить.
это не так работае, как разтаки вы и не втеме. модель ничего не тырит впрямом смысле. она/оно на этом обучается и не хранит в базе
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
 
Opto-эмуляция через моделирование CdS фоторезистора
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.


Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
ии и добралась до остальных компонентов cхемы. да на триоды можно сделать мат модель (только не итеррациями), но проблема в том что она очень ресурсожручая и не оптимизируется. на 3 каскада примерно 800 умножений на семпл.

State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
5000 умножений на семпл. :)

Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза
ии вспомнила про динамическую конволюцию. в свое время focusrite делала такую. называлась она liquid channel кто помнит. как раз для описания поведений приборов динамической обработки. но проблема была в том что все это было очень ресурсоемко и даже при это весьма посредственно иммитировала звучания реальных компрессоров. поэтому была благополучно забыта.

ИТОГО: в отличие от эвалайзеров, которые могут быть достаточно неплохо смоделированы при помощи статической конволюции + перегиба переходной ха-ки (что позволяет сделать плагин который требует 10-15 умножений на семпл). более менее точное физмоделирование или просто моделирование динамической обработки требует построения очень ресурсоемких моделей, которые требуют тысячи MUL/FMA операций на семпл. то есть практически это не реализуемо. это знают все разработчики, которые реально пробовали это сделать.

ИТОГО: ии что то написал, а вы не поняли что. в результате полная идиллия. :)
 
я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе?
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу. Но печально другое - мало кто пока осознает (в экстазе доступности средств производства каждой домохозяйке) что конец приходит всему, потому что всё в мире тысячелетиями выстраивалось по другим законам. Так что да, сейчас практически каждый может создать свой "мини-майкрософт", или топовый "музыкальный проект", за 200 баксов в месяц, не имея представления о самой индустрии. Но самое неприятное в этом что все это ведет к таким последствиям, которые никто пока не в состоянии предсказать, поэтому расстраиваться только о потере работы или ценности инвестиций в собственное развитие и компетенцию - очень недальновидный подход)

Если кому-то многа букв, то смысл тирады в одной фразе:
"Все не так плохо - все гораздо хуже"
 
  • beer
Реакции: dugdum®
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
 
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
 
  • Like
Реакции: dugdum® и evgeny26
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
ну если грубо, то так и работает наш мозг. мы не просто тырим а пересказываем интерпритируем
 
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу.
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
 

Сейчас просматривают