Нейросети и их влияние на будущее синтезаторов и технологии обработки звука. (1 онлайн

baloo · 1 Апр 2024

Нейросетям в аппаратном корпусе синтов, процессоров эффектов, понадобится прежде всего аппаратная часть.
на базе текущих преимущественно Cortex решений, работа ИИ под вопросом. Возможно TexasInstruments или подобные выпустят со временем некий стандарт профильный для интеграции ИИ в корпус синта.

Скорее всего увидим поэтапное развитие ИИ в синтах.
- генератор пресетов
- имитация слепков фильтров, осцев, огибающих изветсных моделей рынка в обход DSP эмуляции, для идентичности звучания
- интеграция на уровне DSP неких базовых блоков, как некий около-стандарт у большинства производителей с сходим функционалом
- развитие самостоятельных аппаратных синтезаторов построенных на базе ИИ как решение в виде:
- отдельного синта с определенным видом синтеза от ИИ
- конструктора синтезатора с возможность задания разработчиком нужной архитектуры
- модулярнеый конструктор синтезатор для пользовательских задач

Аппаратная часть тут не важно, и скорее всего со временем, действительно начнут появляться аппаратные элементы для стройки ИИ
Но сначала производители начнут в ближайший момент с малых вещей. Потому что это оправдано наименьшими рисками бизнес модели, сохранением продаж линеек синтезаторов, путем интеграции небольших опциональных задач в рамках тех же процессоров Cortex (которые у многих, не только Korg ныне).

baloo · 1 Апр 2024

Ну выше описаны шаги по волне, огибайкам, все как достичь нужного. Незнаю как будет звучать - но пример выглядит понятно.
ВСТ редакторы синтов, как раз и должны начать уметь поддерживать "сдалай пресет роя пчел" с вариантами реализации.
Эта инструкция - для учебника пойдет. Но пользователю это не так нужно. задача ИИ - минимизировать время человека на поставленную задачу.

Я пользуюсь 3.5 сейчас при написании плагинов. И мне это сподручно помогает. GPT не делает работу за меня. Просто выдает мне базу по теории там, где есть вопросы. Можно потратить часы на Гугл и не всегда выйти даже за день на нужную информацию. То есть ИИ как помощник в теории синтеза, эффектов - может многое. Вот только 3.5 ограничен базой в 2022г и честно говоря не знает еще многого на эту дату. Отправляя с подробностями к производителю, хотя на отдельных форумах информация все же есть в доступе.

На сегодня - чат дает теорию на комфортном уровне, но как еднситвненый источник образования в звуке - GPT абсолютно точно недостаточен. Слишком часто встречаются неточности или отсутствие информации. По части DSP Кодинга - и говорить не о чем. Пока поверхностно очень.
Лучшее что есть по ИИ - это NAM, Tonex в плане слепков перегруза. Дальше будет больше и интереснее.

alexpen · 1 Апр 2024

nemydom написал(а):
Мне надо звук похожий на рой пчел.

Так чего получилось???
"Рой" как у Jexus'а на джуне получился наконец? :-D

Kokarev Maxim · 1 Апр 2024

Учитывая запросы музыкантов, я две полезные вещи вижу, которые могли бы дать нейросети:
1. Рулёжка синта по промту: пишешь, какой звук нужен, получаешь результат.
2. Рулёжка синта по референсу: даёшь послушать, какой звук нужен, получаешь результат.

А в области плагинов синтов - хз. Их и так переизбыток. Недостаточно просто сделать плагин, который будет пытаться выдать новый звук. Нужно его ещё продать, чтобы окупить трудозатраты

Пользователи обычно ищут старые звуки, которые уже на слуху. Думаю, выгоднее создать серию "нейро" синтов, как гитарные усилители у NeuralDSP: всё те же старые названия оборудования, но с качеством, лучше, чем у существующих vst сейчас. Если это вообще возможно.

TechnoIsBack · 2 Апр 2024

Кое-какие обсуждения были тут.. там на этой странице и ещё на следующих несколько постов в этом ракурсе:

Нейросети пришли и к нам.

Похоже можно не волноваться! Нейронки оказались не такие уж и глупые, чтобы работать безотказно :Dle46:Восстание машин откладывается на неопределённый срок, так как сегодня им чёт лениво всё... а может быть - ... не такие уж и глупые, чтобы работать безотказно бесплатно? )) хотели же, чтоб...

rmmedia.ru

baloo · 2 Апр 2024

Вообще, ИИ интересная штука.
Взять VST SDK к примеру, или аппаратный API, и обучить ИИ этому делу. Ставить задачи и собирать используя ИИ инструменты по промту.

надо будет попробовать кстати что то базовое на ардуино поднять, почему нет. Думаю с этим уже должен легко справиться GPT, с промтом на что либо музыкальное, и подпайкой кнобов кнопок да и дисплеем. Почему нет. Интересная мысль.
в принципе и под Raspberry, можно озадачиться для чего потяжелее
Ну или к примеру к евро реку какому на ардуино вывести дисплей
Это здорово на самом деле, потому что экономит время и помогает реализовать то, на что не хватает времени.

TechnoIsBack · 2 Апр 2024

baloo написал(а):
Вообще, ИИ интересная штука.
Взять VST SDK к примеру, или аппаратный API, и обучить ИИ этому делу. Ставить задачи и собирать используя ИИ инструменты по промту.

Правильно ли я понимаю, что для начала нужно нейросетке скормить тысячи примеров вст синтов удачных и не очень, чтоб нейронка обучилась, и поняла, как в среднем проектируется хороший синт?

baloo · 2 Апр 2024

ИИ нужно начать с примеров в пакете СДК. Или в том же Juce.
Когда он увидит готовые базовые примеры, он сможет начать развивать все необходимое.
Так как учить ему нужно только пакет СДК.
Тысячи примеров ВСТ не нужны, потому что нейроне не нужны они.
Тем более где критерий удачные или нет ВСТ? Все это и так берется и учится базой из обзоров и форумов которые ИИ учит.
То есть главное - понимать СДК, АПИ, а по синтам давать задачи и строить по промту - это уже внешка, не имеющая отношения к СДК, ВСТ. Тут можно сослаться на стандарты железных синтов те же в пример.
Ведь одна задача ИИ знать СДК, АПИ, вторая уметь кодить, три -кодить с учетом базы знаний

Собственно. Chat GPT знает, про синты, знает про SDK. Но вот самому SDK не обучен. Если б прошел обучение - выдавал бы код и структуру проекта, включая VST GUI. Но нет, говорит - в курсе что такое ВСТ, ВСТ СДК, но не изучал его для работы, только владеет общей информацией, без его анализа.

Можно обратиться к ChatGPT - создай файлы VST эффекта фейзера к примеру. И он создаст.
Создас в чате коды нужных файлов, напишет как поставить самому СДК, как назвать эти файлы и как все упаковать.
Все кул. Но по факту - код в примерах дает процентов на 30 и обрубает. Развивает уже в коде по запросу что то не то.Компилишь - не хватает того, чего. Чат отвечает - извините - исправился, добавил. И генерация по запросам идет вечно нового и нового чтоб хоть что то заработало.
Я же говорю о том, чтоб создать ИИ который бы собирал по промту и выдавал папку архива с готовыми файлами. Чего ЧатЖПТ не делает, а только выдает в чате, с огромным процентом недоработок.
Потому что как раз делает это без знания ВСТ СДК, а с примеров в сети. Неумело, не обладая VST SDK, API разных и тд и тп.

Вообще, сейчас много роликов появляется. "Постройте свой ИИ за 6 часов". Покажут как создать и задать обучение ИИ. Я не вникал, и не думаю что это просто, при том что сам програмирую плагины.

по мне -это реально что некто обучил ИИ под ВСТ СДК, АУв3, и прочим форматам. Дабы клевать платины про промту.
Проекты ж выдает на ура под что угодно - хоть ChatGPT, хоть CoPilot.
Думается в сети уже много ИИ, обученных на тех или иных SDK. Даже в среде программирования выполняются задачи, нужно создать и обучить.

То есть, учить примеры сотен и тысяч ВСТ - это бесполезное занятие. Важно владение СДК, АПИ правил, инструментарий в ИИ встроенный, знания глобальные вообще о DSP. И все. Условно,

Lowcut · 2 Апр 2024

вот что-то написало))

using System;
using Jacobi.Vst.Core;
using Jacobi.Vst.Framework;
using Jacobi.Vst.Framework.Plugin;

namespace MyVstSynth
{
public class MyVstPlugin : VstPluginBase
{
private const int NumOscillators = 2;
private readonly Oscillator[] _oscillators = new Oscillator[NumOscillators];

public MyVstPlugin()
: base("My VST Synth", new VstProductInfo("My VST Synth", "My Company", 1000), VstPluginCategory.Synth)
{
// Initialize your plugin here
for (int i = 0; i < NumOscillators; i++)
{
_oscillators = new Oscillator();
}
}

public override VstAudioBuffer Process(VstAudioBuffer[] inChannels, VstAudioBuffer[] outChannels)
{
// Implement your audio processing logic here
// For simplicity, let's just sum the output of both oscillators
for (int channel = 0; channel < 2; channel++)
{
for (int sample = 0; sample < inChannels[0].SampleCount; sample++)
{
outChannels[channel][sample] = _oscillators[0].GenerateSample() + _oscillators[1].GenerateSample();
}
}

return base.Process(inChannels, outChannels);
}
}

public class Oscillator
{
private double _frequency = 440.0; // Default frequency (A4)
private double _phase;

public double GenerateSample()
{
double sample = Math.Sin(_phase * 2 * Math.PI);
_phase += _frequency / SampleRate;

if (_phase >= 1.0)
{
_phase -= 1.0;
}

return sample;
}
}
}

baloo · 2 Апр 2024

Это все понятно. Я получал на вид рабочие структуры плагинов. Десятки раз. Бился над готовым билдом. Бесполезно.
Все что выдает ChatGPT - неполные коды документов, неполный состав файлов. Сплошь недоделки.
А ведь реально бился воевал, собирая проекты в VisualStudio, Xcode.
Знания ChatGPT основаны на примерах кодов из сети.
Самому же VST SDK он не обучен. От того и результат таких генераций.

Здесь нужен не ChatGPT, а нечто типа ИИ c предустановленным инструментарием под задачи VST.

Но это ладно, сегодня смотрел - взять генерацию Arduino IDE проекта к примеру - в легкую собирает код аудио эффектов и синта под ардуино плату. Пусть прсотенькие - но рабочие. Остается коннектить аудио IO к пинам Analog IO, Digital IO.
Здесь понятно, что все в разы проще.

Lowcut · 2 Апр 2024

baloo написал(а):
Это все понятно. Я получал на вид рабочие структуры плагинов. Десятки раз. Бился над готовым билдом. Бесполезно.
Все что выдает ChatGPT - неполные коды документов, неполный состав файлов. Сплошь недоделки.
А ведь реально бился воевал, собирая проекты в VisualStudio, Xcode.
Знания ChatGPT основаны на примерах кодов из сети.
Самому же VST SDK он не обучен. От того и результат таких генераций.

Так для написания кода надо юзать специализированные нейронки, а не ЖПТ.

baloo · 2 Апр 2024

Это понятно, я до CoPilot и прочих не дошел. Еще прийду. Просто пример выше - создать девайс муг-ладдер фильтра или фейзера на ардуинке минутный вопрос в ChatGPT. По аналогии выдаваемые коды под VST проект - несуразны и не являются рабочими.

soup · 3 Апр 2024

nemydom написал(а):
Вот еще, для затравки: попросил chatGPT3.5 и chatGPT4 помочь создать звук. Я сам не силен в саунддизайне, но если кто понимает в этом и так сказать, УМЕЕТ- прокоментируйте пожалуйста!

Вот промт:

Мне надо звук похожий на рой пчел. Пиши только что нажимать и что крутить, пиши последовательно, шаг за шагом. Если ты не можешь указать точный параметр, то точно описывай какой результат я должен услышать, перед тем как переходить к следующему шагу. Все названия кнопок и регуляторов пиши на англиском языке, а все инструкции для меня - на русском. Выдай это в таком виде, как будто ты хочешь написать инструкцию в учебник для студентов университета, изучающих теорию и практику синтеза звука. Все это должно быть на примере синтезатора NORD lead 2x. Синтезатор уже включен, сразу начинай по сути вопроса. Выдай всю инструкцию целиком, без вводных слов, что бы я ее сразу смог скопировать в учебник.

Вот ответ от chatGPT3.5:

Шаг 1: Press the "Oscillator 1" button.

Шаг 2: Turn the "Waveform" knob to select a sawtooth wave.

Шаг 3: Press the "Filter" button.

Шаг 4: Set the "Filter Type" knob to "Low Pass."

Шаг 5: Turn the "Cutoff Frequency" knob to around 800 Hz.

Шаг 6: Increase the "Resonance" knob to about 50%.

Шаг 7: Press the "Envelope" button.

Шаг 8: Set the "Filter Envelope Amount" knob to about 70%.

Шаг 9: Increase the "Attack" knob to around 50%.

Шаг 10: Set the "Decay" knob to around 50%.

Шаг 11: Set the "Sustain" knob to around 50%.

Шаг 12: Increase the "Release" knob to around 70%.

Шаг 13: Press the "LFO" button.

Шаг 14: Set the "LFO Waveform" knob to a triangle wave.

Шаг 15: Turn the "LFO Rate" knob to around 5 Hz.

Шаг 16: Set the "LFO Amount" knob to about 50%.

Шаг 17: Press the "Amplifier" button.

Шаг 18: Set the "Volume" knob to a comfortable level.

Результат: Вы должны услышать звук, напоминающий жужжание пчелы с мягкими изменениями в высоте и глубине.

Шаг 19: Press the "Unison" button.

Шаг 20: Turn the "Unison Detune" knob to around 20%.

Результат: Звук должен стать более плотным и насыщенным, как будто вы слышите несколько пчел одновременно, образуя рой.

Вы видимо не учитываете, что все эти сервисы, это всего лишь лингвистические модели, а не настоящий ИИ, который умеет анализировать исходные данные.

Я сам разработчик, математик, девопс, ну и так далее, вообщем на грани науки и ИТ, в том числе, в разработках, которыми мы занимаемся, есть модули, которые работают на базе нейронок.
Я много использую тот же GPT, но не как заменитель разработчика, а как очень продвинутое средство поиска разрозненной информации, которым он в том числе и является.

Так вот доходило до смешного, кстати, это частая ситуация, просишь тот же гпт накидать на каком-нибудь языке программирования, какой-нибудь простенький код, для вполне простых и четко формализованных целей, он выдает, первые секунды смотришь, радуешься, о, как классно, а потом приглядываешься и обнаруживаешь, что в выданном им коде, скажем для питона вставлены вызовы методов классов, которых в стандартных либах питона - нет, они выдернуты из стандартных либ джавы.

Я собственно к тому, что не путайте лингвомодели с кодебейсом и реальный ИИ(такого пока не существует), они лишь производят поиск в датасетах и по определенным алгоритмам компилируют ответы. Они не анализируют задачи, не выдумывают алгоритмов, не строят логических цепочек и выводов.

Denis12308 · 3 Апр 2024

soup написал(а):
Вы видимо не учитываете, что все эти сервисы, это всего лишь лингвистические модели, а не настоящий ИИ, который умеет анализировать исходные данные.

Я сам разработчик, математик, девопс, ну и так далее, вообщем на грани науки и ИТ, в том числе, в разработках, которыми мы занимаемся, есть модули, которые работают на базе нейронок.
Я много использую тот же GPT, но не как заменитель разработчика, а как очень продвинутое средство поиска разрозненной информации, которым он в том числе и является.

Так вот доходило до смешного, кстати, это частая ситуация, просишь тот же гпт накидать на каком-нибудь языке программирования, какой-нибудь простенький код, для вполне простых и четко формализованных целей, он выдает, первые секунды смотришь, радуешься, о, как классно, а потом приглядываешься и обнаруживаешь, что в выданном им коде, скажем для питона вставлены вызовы методов классов, которых в стандартных либах питона - нет, они выдернуты из стандартных либ джавы.

Я собственно к тому, что не путайте лингвомодели с кодебейсом и реальный ИИ(такого пока не существует), они лишь производят поиск в датасетах и по определенным алгоритмам компилируют ответы. Они не анализируют задачи, не выдумывают алгоритмов, не строят логических цепочек и выводов.

Другими словами весть этот ИИ - Это просто программа для сбора/анализа данных, работающая по алгоритмам которые «запрограммировали» программисты?)) если так то и работать это чудо будет так, как захотят программисты (или люди стоящие над ними)

soup · 3 Апр 2024

@Denis12308, собственно - да. Никакого ИИ, пока нет. Это скорее маркетинг, когда сервисы, которые используют лингвистическое моделирование и датасеты - называют ИИ.
Звучит - круто, но только звучит.
При этом я ни сколько не умоляю того факта, что это очень полезные и крутые штуки. Грамотное их использование может на порядки снизить затраты времени на поиск нужной информации и отсев ненужной.

ПС есть более продвинутые и заточенные под определенный набор задач сервисы, тот же копайлот, там свои кодебейсы, датасеты. Он меньше допускает смешных ошибок при решении задач в области разработки. Но принцип - тот же самый.

ganymed · 3 Апр 2024

nemydom написал(а):
А то что лингвистические модели это "не настоящий ИИ" , это я думаю @soup заблуждается, но это мое мнение - я могу ошибаться. Я например слышал, что есть версия что настоящий человеческий интеллект работает по принципу похожему имено на лингвистические модели!

Рекомендую послушать специалиста по теме мозга. И вот этого.
А не "я слышал что кто-то где-то сказал".
Выше вам специалист из области программирования дал ответ со своей стороны.

ganymed · 3 Апр 2024

nemydom написал(а):
И кстати, а кто вам сказал, что я сам не "специалист из области программирования "?

Я дал и ссылку на специалиста в другой области.
Не нравится Савельев, можете послушать Татьяну Владимировну Черниговскую.
И если вы, как пишите, "специалист из области программирования" то странно читать у вас вот это:
"Я например слышал, что есть версия что настоящий человеческий интеллект работает по принципу похожему имено на лингвистические модели!"
Нет. Конечно, вам никто не запрещает верить во что угодно.

ganymed · 3 Апр 2024

@nemydom, потому я и дал вам ссылку на высказывания именно специалистов в своей области.
И почему вы решили что мы ссоримся?

soup · 3 Апр 2024

nemydom написал(а):
Я думаю как оно работает в деталях точно никто не знает, кроме самих разработчиков OpenAI.

Да почему, вполне себе описана и задокументирована работа и принципы OpenAI например и в частности:

Introduction — Spinning Up documentation

spinningup.openai.com

Как и многих других движков, в плоть до опенсорцных, коих тоже не мало.

Собственно если бы это не было сделано, то весьма затруднительно бы было использовать и эмбендить их в свои решения.

Не надо наводить лишней мистики и вводить себя в заблуждение, ибо это как раз приведет к неправильному пониманию принципов работы с такими системами и к худшим результатам получаемым от них.

TechnoIsBack · 3 Апр 2024

ganymed написал(а):
Рекомендую послушать специалиста по теме мозга. И вот этого.
А не "я слышал что кто-то где-то сказал".

Савельев? Такой себе специалист. Там понтов больше. В какой-то области мозга он явно прохаван. Но благодаря своему снобизму и излишней самоуверенности он часто упускает из вида некоторые важные вещи ... или в упор не хочет принимать аргументы, даже когда ему предлагают ознакомиться с весомыми ссылками на первоисточник. Поэтому трудно судить, на сколько глубоко он шарит и в остальных вещах... лично у меня доверие к его авторитету под сомнением... хотя когда-то прослушал в запой часов 20 его лекций на тему мозга .. стелит красиво

))

Нейросети и их влияние на будущее синтезаторов и технологии обработки звука. (1 онлайн

Hobbyist

Hobbyist

Hobbyist

Distor-Dreamer

Hobbyist

Distor-Dreamer

Well-Known Member

Hobbyist

Hobbyist

ex cool

Well-Known Member

Distor-Dreamer

Well-Known Member

Distor-Dreamer

Well-Known Member

Distor-Dreamer

Well-Known Member

Distor-Dreamer

Well-Known Member

Well-Known Member

Well-Known Member

Hobbyist

Well-Known Member

Hobbyist

Well-Known Member

Hobbyist

Well-Known Member

Well-Known Member

Well-Known Member

Hobbyist

Сейчас онлайн (Пользователей: 0, Гостей: 1)