Telegram Group Search
Назрел вопрос

В нашем чате стало весьма оживленно. Не пора ли сделать в чате темы? Это когда не один единый чат, а несколько тематических чатов. Прошу голосовать тех кто пользуется нашим чатом.

Если будет значительный перевес голосов за темы, обсудим какие темы сделать

Голосуем ниже

#poll
Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning

Модель анализирует изображения на уровне пикселей, улавливает мелкие детали и сложные визуальные отношения, которые трудно выразить текстом

Демо
Код - пока только обучение, без инференса, ждем
Веса

#reasoning #assistant #image2text
Fireworks AI BrowserUse

Агент, вдохновленный OpenManus

→ Ходит в интернет
→ Нажимает кнопки, заполняет формы
→ Извлекает динамический контент
→ Работает с авторизацией модальностями (что это?) и капчами

Код

#agent
В прототипизатор программ Memex добавили поддержку Claude Sonnet 4, Gemini 2.5 Pro и три шаблона MCP

Пробуем

#vibecoding #coding #mcp #mac
This media is not supported in your browser
VIEW IN TELEGRAM
Gemini Speech

генератор речи от Гугла доступен в AI Studio

Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п

Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем

#tts #text2speech
ViewComfy

Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.

Обещают сделать поддержку инпейнтинга

Код
Туториал
Оф канал на ютубе

#comfy2web #webapp
Remade AI Video Canvas

Remade AI сделали холст для работы с видео

Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине

Бонус: забирайте новые лоры спасибо @Vvicca1

#text2video #image2video #lora
QuickVideo

Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма

Код

#VLM #optimization #video2text #realtime
2025/06/12 10:27:24
Back to Top
HTML Embed Code: