This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
DRA-Ctrl: Dimension-Reduction Attack! Video Generative Models are Experts on Controllable Image Synthesis
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
создание и редактирование изображений силами видеогенераторов, в том числе по управляющим изображениям, как контролнет
Прочие возможности: инпейнтинг, персонализация, апскейл, деблюр, предсказание глубины? колоризация
Код
Демо
Веса небольшие кстати
#text2image #image2image #referencing #controlnet #deblur #imagerestoration #personalization #upscale #colorize
Warp 2.0
Агент/кодер
- Agents: запуск и управление несколькими агентами для выполнения различных задач.
- Terminal: современный терминал с улучшенным пользовательским опытом.
- Drive: общее хранилище знаний для команды и агентов.
устанавливается локально
Есть бесплатный тариф
#Windows / #Mac / #Linux
скачать
#desktop #agent #coding
Агент/кодер
- Agents: запуск и управление несколькими агентами для выполнения различных задач.
- Terminal: современный терминал с улучшенным пользовательским опытом.
- Drive: общее хранилище знаний для команды и агентов.
устанавливается локально
Есть бесплатный тариф
#Windows / #Mac / #Linux
скачать
#desktop #agent #coding
This media is not supported in your browser
VIEW IN TELEGRAM
FLUX.1 Kontext [dev] выложили в открытый доступ
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
Напоминаю, это облегченная версия редактора изображений
Веса
Нативная поддержка в ComfyUI
воркфлоу
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Suno - красавцы!
Взяли и пожрали WavTools/DAW.
WavTool это браузерный DAW-софт(Digital Audio Workstation), который объединил профессиональные функции создания музыки (поддержка плагинов VST, редактирование с точностью до сэмпла, запись в реальном времени и многое другое) с собственными возможностями ИИ, такими как разделение стемов, MIDI-файлы, сгенерированные ИИ, и встроенный чат-бот для редактирования музыки в реальном времени.
Представляете какой интерфейс и мощща будут у Suno 5?
https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html
@cgevent
Взяли и пожрали WavTools/DAW.
WavTool это браузерный DAW-софт(Digital Audio Workstation), который объединил профессиональные функции создания музыки (поддержка плагинов VST, редактирование с точностью до сэмпла, запись в реальном времени и многое другое) с собственными возможностями ИИ, такими как разделение стемов, MIDI-файлы, сгенерированные ИИ, и встроенный чат-бот для редактирования музыки в реальном времени.
Представляете какой интерфейс и мощща будут у Suno 5?
https://www.prnewswire.com/news-releases/suno-acquires-wavtool-to-level-up-capabilities-for-professional-songwriters--producers-302491932.html
@cgevent
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution
Улучшайзер видео от анонимных авторов без кода
Модель работает в два этапа: сначала создаёт базовое видео низкого разрешения, а затем повышает его качество до высокого разрешения
Полное видео
#videorestoration #enhancevideo #enhance #superresolution
Улучшайзер видео от анонимных авторов без кода
Модель работает в два этапа: сначала создаёт базовое видео низкого разрешения, а затем повышает его качество до высокого разрешения
Полное видео
#videorestoration #enhancevideo #enhance #superresolution
This media is not supported in your browser
VIEW IN TELEGRAM
4Real-Video-V2: Fused View-Time Attention and Feedforward Reconstruction for 4D Scene Generation
SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.
Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту
Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.
Под капотом гауссианы и еще что-то
Кода нет, ждем в снэпчате?
#4D #textto4d #videoto4D #gaussian #novelview #rendering #research
SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.
Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту
Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.
Под капотом гауссианы и еще что-то
Кода нет, ждем в снэпчате?
#4D #textto4d #videoto4D #gaussian #novelview #rendering #research
Media is too big
VIEW IN TELEGRAM
4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time
И тут же подобная работа от Adobe С КОДОМ‼️
Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.
Объединяет пространство и время, представляя объект как облако 4D гауссиан
Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100
Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)
Код должен быть, проверить не могу
#4D #videoto4D #gaussian #novelview #rendering #imageto4d
И тут же подобная работа от Adobe С КОДОМ‼️
Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.
Объединяет пространство и время, представляя объект как облако 4D гауссиан
Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100
Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)
Код должен быть, проверить не могу
#4D #videoto4D #gaussian #novelview #rendering #imageto4d
Media is too big
VIEW IN TELEGRAM
AnimaX: Animating the Inanimate in 3D with Joint Video-Pose Diffusion Models
Анимация 3D моделей по текстовому описанию или видеообразцу движения
Код ждем
#animation #text2animation #pose2animation
Анимация 3D моделей по текстовому описанию или видеообразцу движения
Код ждем
#animation #text2animation #pose2animation
Matrix-Game: Interactive World Foundation Model
Еще одна модель для создания управляемых "игровых" миров с кодом. Обучена генерировать игровые сцены на основе изображений и пользовательских действий
Обучен на майнкрафте, но может и в другие игры
Код
#scene #image2video #world
Еще одна модель для создания управляемых "игровых" миров с кодом. Обучена генерировать игровые сцены на основе изображений и пользовательских действий
Обучен на майнкрафте, но может и в другие игры
Код
#scene #image2video #world
Появился демоспейс липсинка MultiTalk
Демо
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
Демо
#Lipsync #potraitanimation #speech2video #comfyUI #humananimation