Назрел вопрос
В нашем чате стало весьма оживленно. Не пора ли сделать в чате темы? Это когда не один единый чат, а несколько тематических чатов. Прошу голосовать тех кто пользуется нашим чатом.
Если будет значительный перевес голосов за темы, обсудим какие темы сделать
Голосуем ниже
#poll
В нашем чате стало весьма оживленно. Не пора ли сделать в чате темы? Это когда не один единый чат, а несколько тематических чатов. Прошу голосовать тех кто пользуется нашим чатом.
Если будет значительный перевес голосов за темы, обсудим какие темы сделать
Голосуем ниже
#poll
Нужны темы в чате?
Anonymous Poll
33%
Да, пора. Будет легче ориентироваться в чате
67%
Нет, без них хорошо, давайте оставим как есть
Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning
Модель анализирует изображения на уровне пикселей, улавливает мелкие детали и сложные визуальные отношения, которые трудно выразить текстом
Демо
Код - пока только обучение, без инференса, ждем
Веса
#reasoning #assistant #image2text
Модель анализирует изображения на уровне пикселей, улавливает мелкие детали и сложные визуальные отношения, которые трудно выразить текстом
Демо
Код - пока только обучение, без инференса, ждем
Веса
#reasoning #assistant #image2text
Fireworks AI BrowserUse
Агент, вдохновленный OpenManus
→ Ходит в интернет
→ Нажимает кнопки, заполняет формы
→ Извлекает динамический контент
→ Работает с авторизацией модальностями (что это?) и капчами
Код
#agent
Агент, вдохновленный OpenManus
→ Ходит в интернет
→ Нажимает кнопки, заполняет формы
→ Извлекает динамический контент
→ Работает с авторизацией модальностями (что это?) и капчами
Код
#agent
gen2seg: Generative Models Enable Generalizable Instance Segmentation
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
Stable Diffusion 2 научили сегментировать объекты на картинках
Код
Веса
Демо
Колаб
#segmentation #iamge2mask
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Speech
генератор речи от Гугла доступен в AI Studio
Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п
Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем
#tts #text2speech
генератор речи от Гугла доступен в AI Studio
Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п
Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем
#tts #text2speech
ViewComfy
Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.
Обещают сделать поддержку инпейнтинга
Код
Туториал
Оф канал на ютубе
#comfy2web #webapp
Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.
Обещают сделать поддержку инпейнтинга
Код
Туториал
Оф канал на ютубе
#comfy2web #webapp
Remade AI Video Canvas
Remade AI сделали холст для работы с видео
Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине
Бонус: забирайте новые лоры спасибо @Vvicca1
#text2video #image2video #lora
Remade AI сделали холст для работы с видео
Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине
Бонус: забирайте новые лоры спасибо @Vvicca1
#text2video #image2video #lora
QuickVideo
Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма
Код
#VLM #optimization #video2text #realtime
Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма
Код
#VLM #optimization #video2text #realtime
Форк персонализатора-кастомизатора DreamO с поддержкой лор и квантизацией
petermg DreamO
#personalization #referenceing #tex2image #lora
petermg DreamO
#personalization #referenceing #tex2image #lora
Telegram
Нейронавт | Нейросети в творчестве
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image