Музыкальный вайбкодинг (8 онлайн)

хаха, не прибедняйся. За помещение почти неиспользуемое платишь больше чем за самый крутой тариф у клода.
Это другое ))
Эт жэ больше склад, чем студия.
А так да, правильно говоришь.
 
относительно свежая модель Mercury 2 - типа самый быстрый стрелок Дикого Запада? скорость 1000 токенов в секунду :oops:
https://www.inceptionlabs.ai/models
можно попробовать бесплатно, чат\api 10 million free tokens (результат не проверял, но отвечает очень быстро :D)
 
  • Like
Реакции: Antonio
кто локально вайбкодит - как вам рабочая лощадь из 4х 5060Ti 16Gb?
64 гектара видеопамяьти при NVFP4 квантовании "аналогично" 256Gb fp16 за смешные деньги, но чтобы полный профит получить надо чтобы количество одновременных агентов было тоже 4. Иначе весь профит сьедает PCIE x8 v4
 
Правда, вывод в итоге у него не утешительный, локалка слабовата, а в его случае вообще провал вышел.
Я на lua так же кодил локалкой. Чисто вайбкодить не получится, порой ошибок многовато.
При наличии на борту видеокарты 6Гиг и выше можно нормально кодить с LLM.
Еще зависит от выбора модели. Некоторые заточены под кодинг, другие больше на треп.
 
А кто-нить когда-нить, просил ИИ написать промт для ИИ? Интересно, сработает ли?)))
Это часть моего процесса при генерации изображений. Причём, есть вообще лютая штуковина, которая псевдо креативит в заданных рамках: сперва генератор случайных фраз выбирает рандомные из списка по категориям (сцена, свет, объект и т.д.), а потом результат посылается на llm с заданием "ты проф дизайнер. сформулируй из этих слов промт для генерации изображения.". В итоге, из разрозненных тэгов получается сформулированная задача из нескольких предложений.

Вдобавок, "генерация промта по запросу" СИЛЬНО улучшает детализацию и качество изображений. Потому что нейронка за секунды может написать целый рассказ с подробностями из моих косноязычных нескольких слов.

@basЫl, самое главное, чтоб программа умела с ними работать. К примеру, ComfyUI не умеет складывать видеопамять нескольких карт. Может только распределять ресурсы, например, llm модель на одной, а модель изображений на другой видеокарте.

При наличии на борту видеокарты 6Гиг и выше можно нормально кодить с LLM.
Еще зависит от выбора модели. Некоторые заточены под кодинг, другие больше на треп.
Да знаю я. Но у нас все модели квантованные, потому что полные не влезут в оперативку, не говоря уже про видеопамять. Для понимания масштабов: полная GLM 4.7 весит где то в районе 700 гигабайт. Квантованная до неприличия Q2 GGUF версия весит 130гб. То есть, самая тупая модель нагнёт комп со 128г оперативки.
В этом и проблема локальных моделей - они все урезанные в разной степени, чтобы хоть как то запускаться на домашних компах.
 
  • Like
Реакции: belovw и dugdum®
Да знаю я. Но у нас все модели квантованные, потому что полные не влезут в оперативку, не говоря уже про видеопамять. Для понимания масштабов: полная GLM 4.7 весит где то в районе 700 гигабайт. Квантованная до неприличия Q2 GGUF версия весит 130гб. То есть, самая тупая модель нагнёт комп со 128г оперативки.
В этом и проблема локальных моделей - они все урезанные в разной степени, чтобы хоть как то запускаться на домашних компах.
В любом случае при выборе подходящей модели можно сделать до среднего по размерам проекта.
Также правильно поставленная задача и хорошо прописанная. Хотя все, конечно, не предусмотришь.
Конечно, еще сложность проекта тоже имеет значение.
 
Пока не знаю. В целом вопрос думаю будет стоить не 20 баксов. Например коллега нагенерил на прошлой неделе на 60 баксов. А цели у нас есть куда на большее. Поэтому, обладая ресурсом, изыскиваю варианты реализации.
а как можно потратить денег сверх плана?
если превысил лимит токенов то тебя просто отключат на какое то время и все
можно конечно докупить одноразово
 
Последнее редактирование:
Это часть моего процесса при генерации изображений. Причём, есть вообще лютая штуковина, которая псевдо креативит в заданных рамках: сперва генератор случайных фраз выбирает рандомные из списка по категориям (сцена, свет, объект и т.д.), а потом результат посылается на llm с заданием "ты проф дизайнер. сформулируй из этих слов промт для генерации изображения.". В итоге, из разрозненных тэгов получается сформулированная задача из нескольких предложений.

Вдобавок, "генерация промта по запросу" СИЛЬНО улучшает детализацию и качество изображений. Потому что нейронка за секунды может написать целый рассказ с подробностями из моих косноязычных нескольких слов.

@basЫl, самое главное, чтоб программа умела с ними работать. К примеру, ComfyUI не умеет складывать видеопамять нескольких карт. Может только распределять ресурсы, например, llm модель на одной, а модель изображений на другой видеокарте.


Да знаю я. Но у нас все модели квантованные, потому что полные не влезут в оперативку, не говоря уже про видеопамять. Для понимания масштабов: полная GLM 4.7 весит где то в районе 700 гигабайт. Квантованная до неприличия Q2 GGUF версия весит 130гб. То есть, самая тупая модель нагнёт комп со 128г оперативки.
В этом и проблема локальных моделей - они все урезанные в разной степени, чтобы хоть как то запускаться на домашних компах.
1. да, я поэтому и указал, что при раскладке слоев по видяхам НЕСКОЛЬКО агентов работают линейно быстрее.
2. есть такая штука (и ее производные) - MoE (пьянка специалистов): когда контекст вопроса по юриспруденции - незачем помнить про медицину. Это кратно снижает требования к памяти.
 
мини супер-компьютеры для локальных AI моделей :Dle47: :rolleyes:


 
@evgeny26,
1778931108848.png
:rolleyes:цена не компактная ;-)
 
Последнее редактирование:
  • Cry
Реакции: evgeny26
ну это так пока, мысли вслух, может можно не гоняться за компьютерами с киловатными мульти видео картами, для домашнего использования локальных ИИ, и вроде есть варианты подешевле :rolleyes:
 
Имхо, это всё вредные заморочки, использование веб версии в разы эффективнее и экономичнее.
 
  • Like
Реакции: Michael
Сегодня вышла Gemini 3.5 flash. Я в шоке от её возможностей. Приложение на полторы тысячи строк за пол минуты без ошибок. Со звуком и анимацией. С не слабым дизайном.
 
  • я записываю
  • Like
Реакции: belovw и evgeny26
@evgeny26, конечно, на всё новое спрос. А через год эта модель будет стоить копейки. А через два года станет экспонатом в музее. )
 
  • Like
Реакции: evgeny26
у меня уже есть идея его развития , повторить jbridge ) только для Vst3 ) ,с внешним хостом оптимизированным под мультитред) и низкие задержки ))) чтобы разгружать любую DAW ))
 
Небольшой вст хост для превращения любых моно плагинов в дуал моно плагины )
жду фидбэка))
О, welcome to the club :)
пока по "шашечкам", если закрыть морду mono плагина, и заново открыть (или несколько раз быстро нажать show plugin editor ), есть cpu spike \ аудио прерывается и возвращается с щелчком,
1782414913928.png

похоже, либо что то в хосте трогает audio thread при открытии GUI, или пытается заново полностью загрузить плагин, а не просто скрыть \ открыть GUI. навскидку ИИ порекомендовал проверить:
  1. Keep the processor active – never call suspendProcessing on editor close.
  2. Do not delete/reload the plugin instance when the UI is shown/hidden.
  3. If the guest plugin still glitches, hide the editor instead of destroying it.
  4. Ensure the audio thread never waits on a lock held by the GUI during window operations.
 
Последнее редактирование:
Запустил в Рипере через эту приблуду S-gear 3 scuffham AMP. Он монофонический-жутко бесило. Всё работает на даблтреке гитар. Проект после закрытия восстанавливается. Основные регуляторы синхронизируются без нажатия кнопки Sync. Но если переключать пресеты на S-gear, или изменять позицию микрофона (т.е. смена импульса) синхронизируется уже только после кнопки. В целом -работает, но подбешивает, что окно загружаемого плагина моментально закрывается как только тыкаешь мышой в кнопку SYNC. Я понимаю- это фокусировка самой винды, но это сильно затрудняет сценарий использования... А сама идея, конечно, супер!!!
 
но подбешивает, что окно загружаемого плагина моментально закрывается как только тыкаешь мышой в кнопку SYNC.
можно поправить )

" Но если переключать пресеты на S-gear, или изменять позицию микрофона (т.е. смена импульса) синхронизируется уже только после кнопки." , это именно плагин стейт , можно сделать опрос по таймауту , но это может вызвать лаги ) и зависоны ) кнопкой надежнее

это именно ограничение vst3 - он может передавать свое состояние в DAW ,а может не передавать ( это как разработчик решил ) ..



вот сделал принудительное открытие окна после кнопки sync)
 

Вложения

Последнее редактирование:
Квадрафуззик открывает, а на баспрофессоре зависает. Какой-то косяк есть в приложеньке.
странно, у меня не зависает, пробовал несколько плагинов в Studio1 и Bitwig (только щелчки при закрытии \ открытии GUI нервируют :eek: )
я бы вообще обьединил их в одно окно, кнопки \ настройки хоста в верхней панели, моно плагин открывается под ней, GUI хоста ресайзится под размер плагина и не надо ничего закрывать\открывать. :rolleyes:
 
Последнее редактирование:
странно, у меня не зависает, пробовал несколько плагинов в Studio1 и Bitwig
А ну спроси у своего кантютера почему в кьюбейсе виснет приложенька, а в других daw нет? Пусть подсказывает какие болты и гайки нужно подкрутить. Пусть хотя бы сделает так, чтобы приложенька во всех daw зависала :Dle46:
 
  • Haha
Реакции: evgeny26
А ну спроси у своего кантютера почему в кьюбейсе виснет приложенька, а в других daw нет?
похоже этот кубейс слишком правильный :oops:
Cubase strictly follows the VST3 specification regarding view lifecycle and threading.

Other hosts may be more lenient (e.g., they do not destroy the view when you close the editor, or they synchronise calls differently).

That’s why a wrapper that works perfectly in Bitwig can deadlock in Cubase – it exposes flaws in your state‑machine and thread management that other hosts silently tolerate.
 

Сейчас просматривают