Музыкальный вайбкодинг (11 онлайн)

sorry за прямоту, но вы просто не в зуб ногой в теме
вы тут не первый хейтер, тоже извините за прямоту, просто не интересно вашими страхами и переживаниями на тему профессии заниматься и вести диалог на эти темы )
 
она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.
Сам столкнулся с подобным, когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA.
 
когда копилотом пытался найти алгоритм ЛА-2А. Он мне собрал примитивный VCA
Предположим собрал. А доработать? А поменять алгоритмы? Попробовать разные?
Слишком быстро нейросетки развиваются. Ну вот навскидку, экспресс:

Для точного VST3 копирования LA-2A на JUCE есть несколько подходов:

  1. Opto-эмуляция через моделирование CdS фоторезистора — самый важный компонент. Его сопротивление меняется нелинейно и с гистерезисом. Моделируют через RC-цепочку с переменным сопротивлением (LDR — Light Dependent Resistor). Ключевые параметры: время включения/выключения ~10-15ms / 60-150ms (зависит от глубины компрессии), память эффекта (hysteresis).
  2. Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
  3. State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
  4. Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза, наложенный сатурационный clipper на выходе (имитация трансформатора и ламп).
Рекомендация: для максимального сходства — гибрид: opto-ячейка через физическую модель LDR (решение диффура с переменным сопротивлением) + WDF или wave digital модель лампового усилителя на выходе. В JUCE готовые классы в dsp модуле не помогут — придётся писать самому.


ну уровне промптов можно детальнейшим образом вмешиваться в куски кода и их модифицировать на своё усмотрение, при этом никакого геморроя.
а если какой-то алгоритм не до конца понятен, то можно попросить ИИ агента внести в файлы подробные комментарии на русском. он каждую строчку кода распишет... и так уже вручную будет легче внести какие-то правки.
 
Последнее редактирование:
  • Like
Реакции: belovw
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
 
@dugdum®, я с Вами не спорю. Делюсь своим опытом, который по сравнению с вашим отстал от действительности достаточно на долго. Мы же здесь собрались для того чтобы делиться.
я так понял года на 3. и это прямо пропасть ) поэтому можно смело браться за старое и снова попробовать, если есть интерес.
вот сходу рекомендую модель Big Picle в Open Code попробовать, это бесплатно и места не занимает. (как я понял погуглив, это свежее, оно на тестировании и через какое-то время перейдёт в платное)
 
Последнее редактирование:
не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну.
если просто с наскока спросить чат-бот (тем более если бесплатный), то скорее всего результат будет как спросить бабушку, или продавщицу кваса,
а для более специфических, серьёзных задач, нужно подход более серьёзный,
выбрать подходящую платную модель (желательно последих версий), создать проект, с нужной информацией (можно схемы, можно документацию, можно книжки по созданию DSP алгоритмов которые ИИ проработает), тогда можно ожидать более правильных ответов, как то так :rolleyes:
 
  • Like
Реакции: dugdum®
Зависимость от онлайн моделей — не Айс! В любой момент либо вырубят, либо что то поменяется.
Локальные модели требуют больших ресурсов, видеокарты, оперативки и.т.д... Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
Не совсем верный стереотип, что динозавры набирают 100500 строк кода ручками. Они же тоже не первый день замужем, там уже все настроено и воркфлоу и куча шаблонов, библиотек, своих наработок и.т.д... CTRL+С и CTRL+V кусками по 1000 строк, несколько правок и все готово.
 
тут есть еще проблема, вслучае какихто форсмажоров большая часть проектов на вайбкоде встанут, если "вайб кодеры" потеряют доступ к ИИшкам.
чтоб запустить и крутить локальную модель нужны большие ресурсы
 
Спорный вопрос что быстрее, навайбкодить какую нибудь программку за 2-3 часа на мега-навороченном компе, либо написать её ручками за те же 2-3 часа (а то и быстрее) на калькуляторе.
при таком сценарии, можно и ручками,
а вот если ручками день, а на следующий ещё продолжать, а с ИИ 2-3 часа ? :rolleyes:

ИИ это инструмент. можно пользоваться, для экономии времени, можно не пользоваться.
можно вручную винтики закручивать, даже при наличии электроотвертки.
 
  • Like
Реакции: АлександрSova
максимум что он может - это стырить.
это не так работае, как разтаки вы и не втеме. модель ничего не тырит впрямом смысле. она/оно на этом обучается и не хранит в базе
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
 
Opto-эмуляция через моделирование CdS фоторезистора
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.


Моделирование в стиле Wave Digital Filters (WDF) — ламповые каскады (12AX7, 12BH7) как нелинейные элементы, решаемые через итерации Ньютона-Рафсона. Самый точный, но тяжёлый.
ии и добралась до остальных компонентов cхемы. да на триоды можно сделать мат модель (только не итеррациями), но проблема в том что она очень ресурсожручая и не оптимизируется. на 3 каскада примерно 800 умножений на семпл.

State Variable / ODE solver подход — моделирование всей схемы как системы дифференциальных уравнений (например, модифицированный nodal analysis), численное решение.
5000 умножений на семпл. :)

Аппроксимация «на слух» — эмуляция передаточной характеристики opto-пары через кусочно-линейные кривые + таблицы предрасчитанных времён атаки/релиза
ии вспомнила про динамическую конволюцию. в свое время focusrite делала такую. называлась она liquid channel кто помнит. как раз для описания поведений приборов динамической обработки. но проблема была в том что все это было очень ресурсоемко и даже при это весьма посредственно иммитировала звучания реальных компрессоров. поэтому была благополучно забыта.

ИТОГО: в отличие от эвалайзеров, которые могут быть достаточно неплохо смоделированы при помощи статической конволюции + перегиба переходной ха-ки (что позволяет сделать плагин который требует 10-15 умножений на семпл). более менее точное физмоделирование или просто моделирование динамической обработки требует построения очень ресурсоемких моделей, которые требуют тысячи MUL/FMA операций на семпл. то есть практически это не реализуемо. это знают все разработчики, которые реально пробовали это сделать.

ИТОГО: ии что то написал, а вы не поняли что. в результате полная идиллия. :)
 
я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе?
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу. Но печально другое - мало кто пока осознает (в экстазе доступности средств производства каждой домохозяйке) что конец приходит всему, потому что всё в мире тысячелетиями выстраивалось по другим законам. Так что да, сейчас практически каждый может создать свой "мини-майкрософт", или топовый "музыкальный проект", за 200 баксов в месяц, не имея представления о самой индустрии. Но самое неприятное в этом что все это ведет к таким последствиям, которые никто пока не в состоянии предсказать, поэтому расстраиваться только о потере работы или ценности инвестиций в собственное развитие и компетенцию - очень недальновидный подход)

Если кому-то многа букв, то смысл тирады в одной фразе:
"Все не так плохо - все гораздо хуже"
 
  • beer
Реакции: dugdum®
Почитайте хотя бы базово про next-token prediction и SGD, прежде чем кидаться словом «тырит».
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
 
и что. допустим мы снимем вольтамперную ха-ку оптрона. что она нам даст без моделирования всей остальной схемы? + моделирование оптрона через RC цепочку - это очень оригинально но не работает. + ии правильно упомянул про гистерезис! то есть у вас вольтамперная ха-ка будет меняться в зависимости от конкретного напряжения. пытаться описать это формулой сложно. теоретически можно попробовать описать через здоровенную многомерную таблицу, но сперва надо разработать корректную методику сьема и сделать лабораторную работу по заполнению этой таблицы. развлекухи - не на один день.
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
 
  • Like
Реакции: dugdum® и evgeny26
если очень грубо - это алгоритм подбора самого вероятного слова на базе того что было написано ранее.
ок, давайте назовем ии не "тырилка" а "копирайтер". он не просто тырит, а пересказывает стыренное своими словами. :)
ну если грубо, то так и работает наш мозг. мы не просто тырим а пересказываем интерпритируем
 
Небольшой оффтоп. Время нас, проф.разрабов, как ни прискорбно, приходит к концу.
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
 
Если новые технологии создал человеческий мозг, то создаст и ИИ рано или поздно потому, что принцип работы один и тот же, разница на данном этапе только в архитектуре и реализации. И думающим людям давно страшновато от того что происходит... Но это оффтоп конечно...
 
  • Like
Реакции: euggie2000
ну если грубо, то так и работает наш мозг.
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
 
Последнее редактирование:
до чего дошел прогресс! :)


sorry за прямоту, но вы просто не в зуб ногой в теме, поэтому у вас и возникает ощущение, что там все сложнее чем "просто стырил".
я разными алгоритмами dsp давно занимаюсь и многие из них писал сам с нуля. не так давно мучил гпт по поводу написания нескольких алгоритмов. и к сожалению максимум что он может - это стырить. иногда тырит с ошибками. если просить его модифицировать алгоритм - происходит полная шляпа. это как просить бабушку сидящую у подъезда слетать побыстрому на Луну. :)

примерно так - есть спецы по dsp, которые могут написать библиотеку с нуля. их примерно 0.1%. и есть 99.9% просто приграммистов, которые максимум что могут - взять готовую библу и подключить ее в свой проект. именно это и делает ии. в лучшем случае. наверное круто навайбкодить эдитор. в ручную его писать долгое и нудное дело. но насчет алгоритмов - ии вообще ничего не знает о том как работает LA2A. маскимум - она найдет опенсорсный проект в котором кто то как то пытался иммитировать работу LA2A, сопрет оттуда код алгоритма и адаптирует его под текущий плаг. а не найдет LA2A, то возьмет алгоритм первого попавшегося компрессора и ничего тебе об этом не скажет.

я это к тому, что какой смысл делать такие плаги? чем это отличается от приграммирования в синтэдиторе? там ты хотя бы честно сам собираешь цепочку из стандартных эффектов. а тут что и где нашла ии вообще непонятно. такого Г на просторах и-нета валяется великое множество. ;)
Интересно было почитать комментарий реального производителя конечно. Собственно, вот и расставлены точки над ё, как по мне. По собственным ощущениям, в вайбкодинге чисто психологически появляется это ощущение «своё, домашнее оно же вкуснее», это интересно как процесс, как навыки на будущее, но как конечный продукт, учитывая уже перегруженный рынок профессионального качественного софта, такие цифровые поделия не стыдно использовать лишь самому, или паре друзей показать, дескать «сам». Но уровень ответственности реального производителя, продающего годами свой товар людям за их кровные, и домашних любопытствующих энтузиастов мягко говоря очень разный. Но опять же, прогресс, приходится один хер все это изучать..
 
да с чего бы это? домохозяйка с ии сделает кучу Г которое никому не нужно. ей прикольно, но не более того. и до этого была куча плагов сделанная в синтэдиторе и что они поменяли? новую технологии ии не создаст, потому что она банально думать не может. может только попытаться самое вероятное слово на базе предыдущих. но этого недостаточно.

но однозначный плюс - ускорение работы, если ии будет брать на себя тупую работу по прописыванию гуев или чему то подобному.
Лично мне очень импонирует ваш оптимизм)
 
  • beer
Реакции: dugdum®
не совсем. смотрите, есть инженер, а есть разработчик. инженера учат делать какие то стандартные задачи стандартным способом.
если надо рассчитать фундамент здания - он берет учебник по физике грунтов, по железобетонным конструкциям по сопромату. находит тами нужные формулы и коэффициенты, считает и говорит, то на таких то грунтах при таком то весе нам надо столько то квадратных метров опоры. то есть стандартная задача. и в принципе ии может ее сделать, заменив инженера! НО ии не сможет сделать новую методику расчетов! там думать надо, а это ии не дано. в этом и разница.

само собой что в 99% случаев человек выполняет какие то стандартные операции, которые может с успехом решить ии. но 1% на творчество все равно остается.

+ есть одна очень большая проблема с использованием ии! она называется "без гарантий". ии не предназначен для 100% верного решения каких то задач. допустим того же расчета фундамента. для этого есть специализированные программы. туда вносишь входные данные и получаешь гарантированный результат. а как посчитало ии? по каким формулам? надо это перепроверять! но если надо перепроверить (считай сделать расчет по новой), на кой хрен нужна ии?

сейчас идет ии хайп. и все домохозяйки садятся кодить плюгины, но хайп спадет и там посмотрим. это так же как с ютюбом. когда он появилися все домохозяйки стали блохерами. только деньги на этом зарабатывают единицы. :)
Вообще в современном мире (и рынке) уживаются многие артефакты прошлого с современными технологиями: виниловые пластинки с облачными сервисами, драматические театры с облачными сервисами, даже проститутки с облачными сервисами. Это все мило и внушает надежду, но только единственная аналогия меня нервирует: конь и двигатель внутреннего сгорания. Если ИИ - это ДВС, а наши профессии - это конь, то нам пздц
 
Прикол в другом - если на выходе подходящий для музыканта звук, есть ли смысл в "трушности" модели?
крутые дядьки пишут, что да. что звук LA2A или 1176 в софте никто так им не смог повторить. эаметьте, даже если сводят в компе, то вся динамика стоит рядом в стойке и народ замолачивается за то, чтобы выкинуть дорогу в аналог, пожать и ее и затянуть назад! аналоговых эквалайзеров (кроме мастерингистов) ни у кого нет, а вот вся динамика есть в оригинальных железках.

и тут все просто. обычный EQ со статической импульсной можно считать через FFT. это быстро и просто. а динамическую конволюцию (даже если ты создашь эпическую базу импульсных откликов) быстро посчитать не получится. если импульс у тебя 200 семплов то на круг получишь 200FMA операций на один входной семпл. если отклик 1000, то получишь 1000FMA операций и один входной канал на 48kHz положит твой компик на бок.

но можно извратиться и считать все на видеокарте. это конечно тот еще гемор, так как там расчет целочисленный и в 8/16 битный. но думаю на какой нибудь RTX1580 можно сделать онлайн расчет пары каналов очень точной физмодели LA2A. но сдается мне, что немного людей будут покупать для этого RTX1580. для игр и ии купят, а вот для моделей компрессоров - врядли. :)
 
Последнее редактирование:

Сейчас просматривают