Media is too big
    VIEW IN TELEGRAM
  Odyssey-2
Интерактивный генератор видео в реальном времени, 20fps.
Можно кидать промпты прямо на лету, влияя на дальнейший ход видео
А вот как его потом скачать я не нашел. Но можно шерить ссылки
Поиграть можно здесь
#text2video #realtime #streaming
Интерактивный генератор видео в реальном времени, 20fps.
Можно кидать промпты прямо на лету, влияя на дальнейший ход видео
А вот как его потом скачать я не нашел. Но можно шерить ссылки
Поиграть можно здесь
#text2video #realtime #streaming
👍8
  This media is not supported in your browser
    VIEW IN TELEGRAM
  AI-видео за вечер: как крупные бренды обходятся без студий
Crush Media протестировали связку нейросетей для видеопродакшена и получили ролики, сравнимые с продакшном крупных брендов — Moscow Fashion Week, Google, Volkswagen.
Что внутри:
• формулируете идею в 2–3 строки
• нейросеть собирает основу визуала
• финальная доработка в редакторе 5–7 минут
⚡  В результате: готовое коммерческое видео, полностью созданное ИИ, без команды и бюджетов студии.
📌  Библиотека бесплатных уроков с промптами и трюками ИИ:  @crushmedia_ai
#промо #ai #video #midjourney #runway #neuralnet
Crush Media протестировали связку нейросетей для видеопродакшена и получили ролики, сравнимые с продакшном крупных брендов — Moscow Fashion Week, Google, Volkswagen.
Что внутри:
• формулируете идею в 2–3 строки
• нейросеть собирает основу визуала
• финальная доработка в редакторе 5–7 минут
#промо #ai #video #midjourney #runway #neuralnet
Please open Telegram to view this post
    VIEW IN TELEGRAM
  🔥3❤2😁2🥴2🍌1
  Generative Omnimatte: Learning to Decompose Video into Layers 
Модель от Google DeepMind раскладывает видео на слои (omnimatte-слои), где каждый слой содержит полностью видимый объект и связанные с ним эффекты, например, тени и отражения.
Использует генеративные и семантические данные для дополнения скрытых пикселей и точного связывания эффектов с объектами
Код - тут неофициальная реимплементация на основе CogVideoX и Wan2.1, которая, как признают авторы, чуть слабее чем официальная Casper на основе Lumiere
Спасибо @Ildar_Idrisov
#video2matte #video2mask #rgb2rgba #segmentation
Модель от Google DeepMind раскладывает видео на слои (omnimatte-слои), где каждый слой содержит полностью видимый объект и связанные с ним эффекты, например, тени и отражения.
Использует генеративные и семантические данные для дополнения скрытых пикселей и точного связывания эффектов с объектами
Код - тут неофициальная реимплементация на основе CogVideoX и Wan2.1, которая, как признают авторы, чуть слабее чем официальная Casper на основе Lumiere
Спасибо @Ildar_Idrisov
#video2matte #video2mask #rgb2rgba #segmentation
🔥11👍4
  This media is not supported in your browser
    VIEW IN TELEGRAM
  Elevenlabs VOICE ISOLATOR
Elevenlabs запустили функцию очистки голосовых записей от шумов.
Прямой конкурент Adobe podcast
На бесплатном тарифе дают 10 минут обработать бесплатно
Но я смог потестить инкогнито, не логинясь...
Но надо притвориться что вы не в России.
Результат кину в коменты, и для сравнения результат от Adobe
#audio2audio #audiodenoise #audioenhance #enhance #voiceseparation #demix
Elevenlabs запустили функцию очистки голосовых записей от шумов.
Прямой конкурент Adobe podcast
На бесплатном тарифе дают 10 минут обработать бесплатно
Но я смог потестить инкогнито, не логинясь...
Но надо притвориться что вы не в России.
Результат кину в коменты, и для сравнения результат от Adobe
#audio2audio #audiodenoise #audioenhance #enhance #voiceseparation #demix
👍8
  Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
    VIEW IN TELEGRAM
  Адобченко поднимает веки. Генерация и редактирование по слоям.
Много новостей прилетело изподадоба. На пару постов.
Прежде всего они выпустили Firefly Image Model 5 и там есть редактирование и слои.
Картинка генерится сразу со слоями, каждый слой можно перегенерировать, таскать по картинке, вращать, масштабировать - перегенерация почти мгновенная.
А как он бьет на слои, спросите вы?
А примерно также как в Reve.art - сегментацией картинки на объекты внутри общей композиции. Сколько нашел, cтолько слоев и сделал. Влиять на это нельзя.
Также можно заметить, что при перегенерации\редактировании слоя-объекта он чуть шевелит остальные "слои", что в принципе малозаметно и в пределах погрешностей редактирующих генераторов. Круто, что тени и отражения отрабатываются с учетом "отношений" между объектами.
В общем у Адобченко теперь своя Нанабанана со своим интерфейсом (это не отменяет того факта что гугловая Нанабанана также присутствует в списке "прочих моделей" уже некоторое время).
На видео заметно, что с текстом вообще-то беда. Но в любом случае, чем больше редактирующих моделей, да еще и с хорошим UI\UX - тем лучше.
@cgevent
Много новостей прилетело изподадоба. На пару постов.
Прежде всего они выпустили Firefly Image Model 5 и там есть редактирование и слои.
Картинка генерится сразу со слоями, каждый слой можно перегенерировать, таскать по картинке, вращать, масштабировать - перегенерация почти мгновенная.
А как он бьет на слои, спросите вы?
А примерно также как в Reve.art - сегментацией картинки на объекты внутри общей композиции. Сколько нашел, cтолько слоев и сделал. Влиять на это нельзя.
Также можно заметить, что при перегенерации\редактировании слоя-объекта он чуть шевелит остальные "слои", что в принципе малозаметно и в пределах погрешностей редактирующих генераторов. Круто, что тени и отражения отрабатываются с учетом "отношений" между объектами.
В общем у Адобченко теперь своя Нанабанана со своим интерфейсом (это не отменяет того факта что гугловая Нанабанана также присутствует в списке "прочих моделей" уже некоторое время).
На видео заметно, что с текстом вообще-то беда. Но в любом случае, чем больше редактирующих моделей, да еще и с хорошим UI\UX - тем лучше.
@cgevent
😱7🔥3❤2
  10-шаговый WAN 2.2 от подписчика.
Интегрирована лора lightx rank 256 bf16
на данный момент есть модели fp16, fp8 и q8_0
https://huggingface.co/StefanFalkok/Wan_2.2_10steps/tree/main
https://huggingface.co/StefanFalkok/Wan_2.2_10steps_GGUF/tree/main
Спасибо @stefanfalkok
#gguf #optimization
Интегрирована лора lightx rank 256 bf16
на данный момент есть модели fp16, fp8 и q8_0
https://huggingface.co/StefanFalkok/Wan_2.2_10steps/tree/main
https://huggingface.co/StefanFalkok/Wan_2.2_10steps_GGUF/tree/main
Спасибо @stefanfalkok
#gguf #optimization
👍16🔥4❤3
  LightVAE и LightTAE
Оптимизация VAE wan 2.1 и wan 2.2 от команды LightX2V
— LightVAE - баланс между качеством, скоростью и памятью, потребляет примерно на 50 % меньше памяти, чем официальные модели, работает в 2–3 раза быстрее
— LightTAE - использует минимум памяти (около 0,4 ГБ), работает быстрее официальных VAE более чем в 10 раз и превосходит открытые TAE-модели
Поддерживают различные форматы, включая BF16 и FP8.
HF
ComfyUI-LightVAE
Спасибо @m_franz
#wan22 #optimization
Оптимизация VAE wan 2.1 и wan 2.2 от команды LightX2V
— LightVAE - баланс между качеством, скоростью и памятью, потребляет примерно на 50 % меньше памяти, чем официальные модели, работает в 2–3 раза быстрее
— LightTAE - использует минимум памяти (около 0,4 ГБ), работает быстрее официальных VAE более чем в 10 раз и превосходит открытые TAE-модели
Поддерживают различные форматы, включая BF16 и FP8.
HF
ComfyUI-LightVAE
Спасибо @m_franz
#wan22 #optimization
👍13🔥4
  Media is too big
    VIEW IN TELEGRAM
  Cursor 2.0
В обновлении ИИ-кодера представлена собственная модель-программист — Composer, в 4 раза быстрее аналогичных моделей, умеет эффективно работать с большими кодовыми базами благодаря встроенному семантическому поиску. По метрикам отстает лишь от от GPT-5 и Sonnet 4.5.
— новый интерфейс, ориентированный на работу с агентами, а не с файлами
— появилась возможность запускать множество агентов параллельно без взаимного влияния, используя git worktrees или удалённые машины
— упрощён процесс просмотра изменений, внесённых агентами, и углублённого анализа кода
— добавлен встроенный инструмент для тестирования работы агентов и итеративного улучшения результатов
— добавлен голосовой режим
Скачать
#coding #windows #macos #linux #desktop #vibecoding
В обновлении ИИ-кодера представлена собственная модель-программист — Composer, в 4 раза быстрее аналогичных моделей, умеет эффективно работать с большими кодовыми базами благодаря встроенному семантическому поиску. По метрикам отстает лишь от от GPT-5 и Sonnet 4.5.
— новый интерфейс, ориентированный на работу с агентами, а не с файлами
— появилась возможность запускать множество агентов параллельно без взаимного влияния, используя git worktrees или удалённые машины
— упрощён процесс просмотра изменений, внесённых агентами, и углублённого анализа кода
— добавлен встроенный инструмент для тестирования работы агентов и итеративного улучшения результатов
— добавлен голосовой режим
Скачать
#coding #windows #macos #linux #desktop #vibecoding
👍2
  INFINITE AI WEB
Смотрите какая штука. Этак же можно подсунуть кому-нибудь фейковый интернет.
Динамический генератор веб-контента на Gemini 2.0 Flash
Создаёт контент для любого URL-адреса, достаточно ввести путь в браузере. Потом можно кликнуть на какую-нибудь ссылку на этой странице и перейти на новую сгенерированную страницу
#text2site #text2web
Смотрите какая штука. Этак же можно подсунуть кому-нибудь фейковый интернет.
Динамический генератор веб-контента на Gemini 2.0 Flash
Создаёт контент для любого URL-адреса, достаточно ввести путь в браузере. Потом можно кликнуть на какую-нибудь ссылку на этой странице и перейти на новую сгенерированную страницу
#text2site #text2web
👍5
  Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
      VIEW IN TELEGRAM
    This media is not supported in your browser
      VIEW IN TELEGRAM
    This media is not supported in your browser
      VIEW IN TELEGRAM
    This media is not supported in your browser
      VIEW IN TELEGRAM
    This media is not supported in your browser
      VIEW IN TELEGRAM
    This media is not supported in your browser
      VIEW IN TELEGRAM
    Адоб со своими продуктами превратился в нейрокомбайн и фичи которые показывали на конференции реально сильно меняют индустрию, фото и видео. Продукты адоб с нейронками и без это, как компьютер с интернетом и без.
1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать😭 
Всю трех часовую конфу можно посмотреть на YT
@CGIT_Vines
1. Сегментация звука и разбивка по источникам звука которые можно редактировать.
2. Транскрибция голоса и редактирование отдельных слов с сохранением консистентности голоса говорящего 🤌
3. Изменение наративного повествования с добавлением эмоции в голос (шепот, грусть, уверенность и т.д.)
4. Релайт сцены с предварительным переводом сцены в драфт 3D.
5. Выделение некоторых объектов на видео и перевод их в 3D с текстурами, объекты можно вращать, менять перспективу под ракурс и потом апскейлить, если текстурки немного пожались при искажениях ☠️
6. Удаление источника света который дает засвет в кадр, с изменением самого кадра!
Там еще много чего, и так будете опять на меня орать, что видео много качать
Всю трех часовую конфу можно посмотреть на YT
@CGIT_Vines
Please open Telegram to view this post
    VIEW IN TELEGRAM
  🔥6❤1🤷♂1👍1😁1
  This media is not supported in your browser
    VIEW IN TELEGRAM
  Pomelli 
Экспериментальный инструмент от Google, для создания маркетингового контента в едином стиле.
Закидываем на вход сайт компании, на выходе айдентика, цвета, шрифты, логотипы и т д.
Пока доступен в США, Канаде, Австралии и Новой Зеландии, скоро появится и в других странах.
#design
Экспериментальный инструмент от Google, для создания маркетингового контента в едином стиле.
Закидываем на вход сайт компании, на выходе айдентика, цвета, шрифты, логотипы и т д.
Пока доступен в США, Канаде, Австралии и Новой Зеландии, скоро появится и в других странах.
#design
👍3👎2
  Forwarded from CG Kung Fu
Инсайды илм!
Как то пропустил я этот момент но оказывается у нас в студии уже как пару месяцев тестируют все департаменты ИИ в работе, смотрят на что способен. Приходило всем письмо кто хочет поучаствовать в тестах, я видимо проспал этот момент.
Вобщем там результаты ахуеть уже, и фхы и локации и пролеты, илм и дисней приобрели чуть ли не все Ии тулзы и тестируем по максимуму выжимая и проверяя до какого уровня можно дотянуть. Я сам не тестил но коллеги говорят там 90% можно получить быстро а остальные 10% страдаешь и ебешься чтоб добить мелочи и правки и мечтаешь в карме это все быстрее сделать.
Восновном в комфи ИИ сидим.
И такой же слух про другие студии уже есть, днег и прочие сидят тыкают ИИ и тестируют шоты и сцены. И наняты какие то супер умы с phd думают как обвесить ИИ контролами.
Не хочется паниковать, но кажется пора…
Уже вижу как это все будет происходит в будущем, зп снижать нам не будут а будут появляться новые вакансии типа Senior AI Generalist или Senior AI VFX, и будут просто более сжатые дедлайны и больше задач на одного спеца. Короче пиздец.
Как то пропустил я этот момент но оказывается у нас в студии уже как пару месяцев тестируют все департаменты ИИ в работе, смотрят на что способен. Приходило всем письмо кто хочет поучаствовать в тестах, я видимо проспал этот момент.
Вобщем там результаты ахуеть уже, и фхы и локации и пролеты, илм и дисней приобрели чуть ли не все Ии тулзы и тестируем по максимуму выжимая и проверяя до какого уровня можно дотянуть. Я сам не тестил но коллеги говорят там 90% можно получить быстро а остальные 10% страдаешь и ебешься чтоб добить мелочи и правки и мечтаешь в карме это все быстрее сделать.
Восновном в комфи ИИ сидим.
И такой же слух про другие студии уже есть, днег и прочие сидят тыкают ИИ и тестируют шоты и сцены. И наняты какие то супер умы с phd думают как обвесить ИИ контролами.
Не хочется паниковать, но кажется пора…
Уже вижу как это все будет происходит в будущем, зп снижать нам не будут а будут появляться новые вакансии типа Senior AI Generalist или Senior AI VFX, и будут просто более сжатые дедлайны и больше задач на одного спеца. Короче пиздец.
💯10🤔5😁2🥴2
  