На HF появились две дистиллированные модели генератора длинных видео MAGI-1
4.5B_distill и
4.5B_distill_quant
Говорят, что даже на убунту с трудом заводится. А на Windows и подавно
Веса
Ветка на Реддит
#text2video #image2video
4.5B_distill и
4.5B_distill_quant
Говорят, что даже на убунту с трудом заводится. А на Windows и подавно
Веса
Ветка на Реддит
#text2video #image2video
magi.sand.ai
Magi: AI Video Generator & Extender
Unleash limitless creativity with Magi by Sand AI! Generate high-quality AI videos with infinite storytelling and real-time speed. Start creating today!
HunyuanPortrait
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
This media is not supported in your browser
VIEW IN TELEGRAM
spAItial
Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику
Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео
Записаться в вейтлист
#textto3d #text2scene #gaussian
Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику
Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео
Записаться в вейтлист
#textto3d #text2scene #gaussian
Media is too big
VIEW IN TELEGRAM
Дуров объявил о партнерстве Telegram с xAI
Похоже, что летом всем (?) пользователям телеграм станет доступен Grok
Илон Макс прицепом еще и 300 лямов дает. Как так, разве не ему денег должны дать за доступ к гроку? Дело, видимо, в том что телеграм будет продавать подписки на твиттер. Ну и тоже процентик с этого получать
#news #assistant
Похоже, что летом всем (?) пользователям телеграм станет доступен Grok
Илон Макс прицепом еще и 300 лямов дает. Как так, разве не ему денег должны дать за доступ к гроку? Дело, видимо, в том что телеграм будет продавать подписки на твиттер. Ну и тоже процентик с этого получать
#news #assistant
В Krea.ai новая модель для редактирования картинок — Dough. И это вся официальная информация, сами выясняйте что изменилось
Выбора модели для редактирования в интерфейсе нет, так что теперь она по умолчанию
#imageediting
Выбора модели для редактирования в интерфейсе нет, так что теперь она по умолчанию
#imageediting
framepackStudio_core
Маководы возрадуйтесь
3 в 1 для всех десктоп платформ: Framepack, Framepack-F1, Framepack-Studio
Работает на MacOS, Windows and Linux
Да еще и включены свистоперделки: MPS acceleration (MacOS Silicon)
xFormers, FlashAttention и SageAttention для Win/Linux
#macos #image2video #text2video
Маководы возрадуйтесь
3 в 1 для всех десктоп платформ: Framepack, Framepack-F1, Framepack-Studio
Работает на MacOS, Windows and Linux
Да еще и включены свистоперделки: MPS acceleration (MacOS Silicon)
xFormers, FlashAttention и SageAttention для Win/Linux
#macos #image2video #text2video
GitHub
GitHub - loscrossos/framepackstudio_core: CrossOS Framepack. fully accelerated core
CrossOS Framepack. fully accelerated core. Contribute to loscrossos/framepackstudio_core development by creating an account on GitHub.
Hunyuan Video Avatar
Видеоаватар с контролем эмоций от Tencent
Оживляет персонажа по голосу. Речь может сгенерить сам по тексту. На выбор несколько голосов
Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.
Код
Попробовать - на китайском офсайте. Одна секунда Илона Маска генерилась несколько минут
Веса
#lipsync #characteranimation #speech2video #talkinghead #portrainanimation
Видеоаватар с контролем эмоций от Tencent
Оживляет персонажа по голосу. Речь может сгенерить сам по тексту. На выбор несколько голосов
Модель прожорливая: минимум 24 ГБ VRAM для 704x768, а для плавного 4K рекомендуют GPU на 96 ГБ.
Код
Попробовать - на китайском офсайте. Одна секунда Илона Маска генерилась несколько минут
Веса
#lipsync #characteranimation #speech2video #talkinghead #portrainanimation
This media is not supported in your browser
VIEW IN TELEGRAM
Коллекция лор камеры Wan2.1 14B 480p I2V от Reamde AI
- Crash Zoom In
- Crash Zoom Out
- Crane Up
- Crane Down
- Crane Over the Head
- Matrix Shot
- 360 Orbit
- Arc Shot
- Hero Run
- Car Chase
Демо
Попробовать на Remade Canvas
Скачать
#lora #image2video #text2video
- Crash Zoom In
- Crash Zoom Out
- Crane Up
- Crane Down
- Crane Over the Head
- Matrix Shot
- 360 Orbit
- Arc Shot
- Hero Run
- Car Chase
Демо
Попробовать на Remade Canvas
Скачать
#lora #image2video #text2video
AccVideo Wan
AccVideo опубликовали веса основанные на WanXT2V-14B. Напомню, AccVideo - это метод ускорения видеогенерации
Веса
Веса Kijai FP8
#optimization #text2video
AccVideo опубликовали веса основанные на WanXT2V-14B. Напомню, AccVideo - это метод ускорения видеогенерации
Веса
Веса Kijai FP8
#optimization #text2video
Telegram
Нейронавт | Нейросети в творчестве
AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset
Очередной метод ускорения видеогенерации.
Быстрее Hunyuan в 8.5 раз
Код
HF
#distillation #text2video
Очередной метод ускорения видеогенерации.
Быстрее Hunyuan в 8.5 раз
Код
HF
#distillation #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
ANSE. Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention in Video Diffusion Model
Samsung научил видеогенераторы выбирать самый лучший нойз. Ждем во всех генерилках
Код ждем
#optimization #text2viedo
Samsung научил видеогенераторы выбирать самый лучший нойз. Ждем во всех генерилках
Код ждем
#optimization #text2viedo
FLUX.1 Kontext
Black Forest Labs представила модель для генерации и редактирования изображений. Умеет редактировать картинки по текстовым указаниям и по референсам
Модели позволяют работать с текстом и изображениями, обеспечивают согласованность персонажей и стилей, а также поддерживают интерактивное редактирование с минимальной задержкой.
FLUX.1 Kontext [pro] - быстрое итеративное редактирование
FLUX.1 Kontext [max] - максимальная производительность.
FLUX.1 Kontext [dev] - облегченная версия, сейчас в частном бета-тестировании.
Обещают выложить в опенсорс, а пока можно попробовать. Replicate - требует денег. Про фрипик не знаю
https://playground.bfl.ai/image/generate - новый плейграунд
https://replicate.com/black-forest-labs/flux-kontext-pro
https://replicate.com/black-forest-labs/flux-kontext-max
https://www.freepik.com/ai - не знаю где, пишут что оно там есть
ComfyUI - вы же помните что API платные, да?
Спасибо @iNevestenko
#imageediting #text2image #vibeediting
Black Forest Labs представила модель для генерации и редактирования изображений. Умеет редактировать картинки по текстовым указаниям и по референсам
Модели позволяют работать с текстом и изображениями, обеспечивают согласованность персонажей и стилей, а также поддерживают интерактивное редактирование с минимальной задержкой.
FLUX.1 Kontext [pro] - быстрое итеративное редактирование
FLUX.1 Kontext [max] - максимальная производительность.
FLUX.1 Kontext [dev] - облегченная версия, сейчас в частном бета-тестировании.
Обещают выложить в опенсорс, а пока можно попробовать. Replicate - требует денег. Про фрипик не знаю
https://playground.bfl.ai/image/generate - новый плейграунд
https://replicate.com/black-forest-labs/flux-kontext-pro
https://replicate.com/black-forest-labs/flux-kontext-max
https://www.freepik.com/ai - не знаю где, пишут что оно там есть
ComfyUI - вы же помните что API платные, да?
Спасибо @iNevestenko
#imageediting #text2image #vibeediting