gen2seg: Generative Models Enable Generalizable Instance Segmentation
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Speech
генератор речи от Гугла доступен в AI Studio
Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п
Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем
#tts #text2speech
генератор речи от Гугла доступен в AI Studio
Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п
Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем
#tts #text2speech
ViewComfy
Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.
Обещают сделать поддержку инпейнтинга
Код
Туториал
Оф канал на ютубе
#comfy2web #webapp
Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.
Обещают сделать поддержку инпейнтинга
Код
Туториал
Оф канал на ютубе
#comfy2web #webapp
Remade AI Video Canvas
Remade AI сделали холст для работы с видео
Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине
Бонус: забирайте новые лоры спасибо @Vvicca1
#text2video #image2video #lora
Remade AI сделали холст для работы с видео
Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине
Бонус: забирайте новые лоры спасибо @Vvicca1
#text2video #image2video #lora
QuickVideo
Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма
Код
#VLM #optimization #video2text #realtime
Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма
Код
#VLM #optimization #video2text #realtime
Форк персонализатора-кастомизатора DreamO с поддержкой лор и квантизацией
petermg DreamO
#personalization #referenceing #tex2image #lora
petermg DreamO
#personalization #referenceing #tex2image #lora
Telegram
Нейронавт | Нейросети в творчестве
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
На HF появились две дистиллированные модели генератора длинных видео MAGI-1
4.5B_distill и
4.5B_distill_quant
Говорят, что даже на убунту с трудом заводится. А на Windows и подавно
Веса
Ветка на Реддит
#text2video #image2video
4.5B_distill и
4.5B_distill_quant
Говорят, что даже на убунту с трудом заводится. А на Windows и подавно
Веса
Ветка на Реддит
#text2video #image2video
magi.sand.ai
Magi: AI Video Generator & Extender
Unleash limitless creativity with Magi by Sand AI! Generate high-quality AI videos with infinite storytelling and real-time speed. Start creating today!
HunyuanPortrait
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
Аниматор-оживлятор портретов от Tencent.
Переносит на портрет мимику и движения головы с референсного видео
Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM
Код
Веса
#portrainanimation #lipsync #characteranimation #motion2video
This media is not supported in your browser
VIEW IN TELEGRAM
spAItial
Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику
Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео
Записаться в вейтлист
#textto3d #text2scene #gaussian
Cоздание 3D-контента с помощью пространственных базовых моделей, понимающих геометрию и физику
Судя по видео, создает сцены по текстовому описанию. А судя по анкете, планируют создавать и по фото и по видео
Записаться в вейтлист
#textto3d #text2scene #gaussian
Media is too big
VIEW IN TELEGRAM
Дуров объявил о партнерстве Telegram с xAI
Похоже, что летом всем (?) пользователям телеграм станет доступен Grok
Илон Макс прицепом еще и 300 лямов дает. Как так, разве не ему денег должны дать за доступ к гроку? Дело, видимо, в том что телеграм будет продавать подписки на твиттер. Ну и тоже процентик с этого получать
#news #assistant
Похоже, что летом всем (?) пользователям телеграм станет доступен Grok
Илон Макс прицепом еще и 300 лямов дает. Как так, разве не ему денег должны дать за доступ к гроку? Дело, видимо, в том что телеграм будет продавать подписки на твиттер. Ну и тоже процентик с этого получать
#news #assistant
В Krea.ai новая модель для редактирования картинок — Dough. И это вся официальная информация, сами выясняйте что изменилось
Выбора модели для редактирования в интерфейсе нет, так что теперь она по умолчанию
#imageediting
Выбора модели для редактирования в интерфейсе нет, так что теперь она по умолчанию
#imageediting