Kwai Keye-VL
Модель хорошо понимает короткие видео. Keye-VL имеет 8 миллиардов параметров и умеет обрабатывать информацию из видео и текста
Код
Демо
Веса
#vlm #video2text
Модель хорошо понимает короткие видео. Keye-VL имеет 8 миллиардов параметров и умеет обрабатывать информацию из видео и текста
Код
Демо
Веса
#vlm #video2text
❤7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Depth Anything At Any Condition (DepthAnything-AC)
Генератор глубины изображения. Работает в различных условиях, включая изменения освещения, снег-дождь. Успешно справляется когда есть искажения, вызванные сенсорами.
Представляет собой зафантюненный DepthAnything-V2
Код
Демо
Веса
#video2depth #depth #image2depth
Генератор глубины изображения. Работает в различных условиях, включая изменения освещения, снег-дождь. Успешно справляется когда есть искажения, вызванные сенсорами.
Представляет собой зафантюненный DepthAnything-V2
Код
Демо
Веса
#video2depth #depth #image2depth
❤8👍5
This media is not supported in your browser
VIEW IN TELEGRAM
FreeMorph: Tuning-Free Generalized Image Morphing with Diffusion Model
Морфинг (плавное перетекание) одного заданного кадра в другой за 30 секунд. Полагаю, можно использовать как интерполятор кадров
В 10X ~ 50X быстрее существующих методов, #SOTA в морфинге
Код
#frameinterpolation #morphing
Морфинг (плавное перетекание) одного заданного кадра в другой за 30 секунд. Полагаю, можно использовать как интерполятор кадров
В 10X ~ 50X быстрее существующих методов, #SOTA в морфинге
Код
#frameinterpolation #morphing
🔥12👍4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Kyutai TTS
Генератор речи в реальном времени. Выдает аудиопоток начиная с первых текстовых токенов, без необходимости знать весь текст заранее.
Клонирует голоса на основе 10-секундного аудиообразца. Эта функция сейчас недоступна
Предоставляет таймкоды для каждого генерируемого слова. Это позволяет использовать модель для создания субтитров в реальном времени
Но на данный момент знает только английский и французский языки
Код
Веса
Колаб
#tts #text2speech #voicecloning #realtime
Генератор речи в реальном времени. Выдает аудиопоток начиная с первых текстовых токенов, без необходимости знать весь текст заранее.
Клонирует голоса на основе 10-секундного аудиообразца. Эта функция сейчас недоступна
Предоставляет таймкоды для каждого генерируемого слова. Это позволяет использовать модель для создания субтитров в реальном времени
Но на данный момент знает только английский и французский языки
Код
Веса
Колаб
#tts #text2speech #voicecloning #realtime
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
GaVS: 3D-Grounded Video Stabilization via Temporally-Consistent Local Reconstruction and Rendering
Стабилизация трясущихся видео за счет 3D-реконструкции на гауссианах
Код
#stabilize #gaussian
Стабилизация трясущихся видео за счет 3D-реконструкции на гауссианах
Код
#stabilize #gaussian
🔥14👍1
🛰 VPN для креаторов
💬 Промт: быстрый и стабильный VPN для работы без границ
🔗 Доступ: 3 устройства по одной подписке
💻 Сервера: 🇩🇪🇹🇷🇫🇮🇺🇸
🎁 Промокод:
❇️ Забирай пробную подписку прямо в боте: @starprovpn_BOT
#промо
💬 Промт: быстрый и стабильный VPN для работы без границ
🔗 Доступ: 3 устройства по одной подписке
💻 Сервера: 🇩🇪🇹🇷🇫🇮🇺🇸
🎁 Промокод:
neuronaut
(скидка 40%)❇️ Забирай пробную подписку прямо в боте: @starprovpn_BOT
#промо
👎8💩3👍2🔥2🥴1
Media is too big
VIEW IN TELEGRAM
LongAnimation: Long Animation Generation with Dynamic Global-Local Memory
Создание длинных анимационных видео с согласованным цветом на протяжении всего ролика. Модель умеет автоматически раскрашивать анимации, поддерживая единый стиль и цвет, что важно для анимации.
Менять цвет одежды персонажей можно просто изменив цвет в исходном изображении.
Под капотом CogVideoX-1.5 I2V и пониматор видео Video-XL
Код
#colorize #sketch2animation #image2video #image2animation
Создание длинных анимационных видео с согласованным цветом на протяжении всего ролика. Модель умеет автоматически раскрашивать анимации, поддерживая единый стиль и цвет, что важно для анимации.
Менять цвет одежды персонажей можно просто изменив цвет в исходном изображении.
Под капотом CogVideoX-1.5 I2V и пониматор видео Video-XL
Код
#colorize #sketch2animation #image2video #image2animation
👍9🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Media is too big
VIEW IN TELEGRAM
ИИ Ретоп! Наконец то!
Хуньяньский бахнул новый 3д-генератор.
Его зовут Hunyuan3D-PolyGen.
Это точно не оперсорсная версия 2.1, и скорее всего апгрейд версии 2.5(которая без кода).
Судя по видео, Ретоп выглядит достаточно убойно, но я бы не доверял видосам.
Пишут, что сделали свою авторегрессионную модель для ретопа и теперь хошь в игры, хошь в кино.
Ибо теперь также 10 000+ полигонов на модель и повышенная точность генерации.
Умеет выводить в квады - такое мы любим.
Го тестировать:
https://3d.hunyuan.tencent.com/
@cgevent
Хуньяньский бахнул новый 3д-генератор.
Его зовут Hunyuan3D-PolyGen.
Это точно не оперсорсная версия 2.1, и скорее всего апгрейд версии 2.5(которая без кода).
Судя по видео, Ретоп выглядит достаточно убойно, но я бы не доверял видосам.
Пишут, что сделали свою авторегрессионную модель для ретопа и теперь хошь в игры, хошь в кино.
Ибо теперь также 10 000+ полигонов на модель и повышенная точность генерации.
Умеет выводить в квады - такое мы любим.
Го тестировать:
https://3d.hunyuan.tencent.com/
@cgevent
❤11👍1
This media is not supported in your browser
VIEW IN TELEGRAM
UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
Релайтинг от Nvidia.
Помимо прочего умеет учитывать прозрачность объектов.
Код ждем
#relighting #research
🔥12❤1⚡1
Trae Agent
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
Агент-программист от ByteDance на Claude и Gemini на стадии альфы
Показал высокие результаты на тесте SWE-bench Verified
Обещают добавить поддержку других LLM и MCP
#agent #coding
GitHub
GitHub - bytedance/trae-agent: Trae Agent is an LLM-based agent for general purpose software engineering tasks.
Trae Agent is an LLM-based agent for general purpose software engineering tasks. - bytedance/trae-agent
❤2
Media is too big
VIEW IN TELEGRAM
Fellou: The World's First Agentic Browser
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
"Первый в мире" агентный браузер.
Ну да, можно писать "первый в мире", пока опера дуплится, но тут тоже вход по вейтлисту.
#agent #browser #tools
💩3👍2❤1🤔1🤡1
❗️Ищем будущих специалистов по нейросетям на бесплатное обучение!
Рынок онлайн-работы меняется на глазах. Всё больше компаний ищут тех, кто умеет работать с ИИ и закрывают большие объёмы работы в 2–3 раза быстрее остальных.
Сейчас ты можешь быстро освоить нейросети и выйти на онлайн-заработок уже через 5 дней.
За что платят таким спецам?
— За оформление аккаунтов в соцсетях — от 15 000₽
— За вирусные видео для Reels и TikTok — от 20 000₽
— За тексты и сценарии для видео — от 10 000₽
— За обработку фото и генерацию иллюстраций — от 12 000₽
Таких задач на биржах — тысячи. А специалистов, которые умеют быстро и грамотно ставить задачи нейросети — единицы.
Специально для тебя мы открыли доступ к практическому курсу по нейросетям.
Объясним всё на пальцах. Научим на практике работать с ИИ и поможем найти первые заказы.
➡️Чтобы получить доступ — переходи по ссылке
И учись 5 дней — бесплатно!🔥
#промо
Рынок онлайн-работы меняется на глазах. Всё больше компаний ищут тех, кто умеет работать с ИИ и закрывают большие объёмы работы в 2–3 раза быстрее остальных.
Сейчас ты можешь быстро освоить нейросети и выйти на онлайн-заработок уже через 5 дней.
За что платят таким спецам?
— За оформление аккаунтов в соцсетях — от 15 000₽
— За вирусные видео для Reels и TikTok — от 20 000₽
— За тексты и сценарии для видео — от 10 000₽
— За обработку фото и генерацию иллюстраций — от 12 000₽
Таких задач на биржах — тысячи. А специалистов, которые умеют быстро и грамотно ставить задачи нейросети — единицы.
Специально для тебя мы открыли доступ к практическому курсу по нейросетям.
Объясним всё на пальцах. Научим на практике работать с ИИ и поможем найти первые заказы.
➡️Чтобы получить доступ — переходи по ссылке
И учись 5 дней — бесплатно!🔥
#промо
🤮6🔥4💩4🤡4👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Orchids
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
Сервис для создания приложений и веб-сайтов с помощью чата с ИИ. Обещают что результаты не выглядит «сгенерированными ИИ», превосходство над аналогами втрое, блаблабла. И этот тоже "первый в мире"
На бесплатном тарифе 5 запросов в месяц, деплой одного сайта.
#online #text2site #text2app
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
LangScene-X
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
Создает из набора изображений (от двух, но лучше больше) согласованное видео с учетом 3D, а также трёхмерную сцену, карту сегментации и нормали поверхности
В основе - CogVideoX, а также SAM2 и гауссианы
Код
#image2scene #imageto3d #image2normal #image2mask #image2video #gaussian
❤5😐2
VLM Image Captioning Tool
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
Инструмент для автоматизации описания большого количества изображений. Главная фича - позволяет настроить серию промптов (а не один промпт) для пошагового процесса.
Поддерживает большинство VLM провайдеров, в том числе локальные VLM
Видео
#captioning #image2text #vlm
GitHub
GitHub - victorchall/vlm-caption: Multiturn VLM Bulk captioning using your api service
Multiturn VLM Bulk captioning using your api service - victorchall/vlm-caption
👍3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Гид по цифровому искусству, NFT и не только 📸
Анна Левен — директор барселонской галереи Load, экс-газетчик (The Art Newspaper London), продюсер и консультант в сфере цифрового искусства и блокчейна.
В её Telegram-канале вас ждёт:
🌟 AI-искусство, NFT и актуальные digital-проекты
🌟 Начинающие художники (например, Симон Рюден — бывший солист шведского балета, а теперь мастер цифровых пейзажей) и признанные классики медиа искусства.
🌟 События, статьи и неочевидные мысли о современном искусстве
🌟 Покупки удивительных, но в то же время доступных произведений искусства
Этот канал — ваш путь в мир небанального цифрового искусства.
Подписывайтесь на Анну Левен, чтобы оставаться в курсе самого интересного в мире digital-арта⬆️
#промо
Анна Левен — директор барселонской галереи Load, экс-газетчик (The Art Newspaper London), продюсер и консультант в сфере цифрового искусства и блокчейна.
В её Telegram-канале вас ждёт:
Этот канал — ваш путь в мир небанального цифрового искусства.
Подписывайтесь на Анну Левен, чтобы оставаться в курсе самого интересного в мире digital-арта
#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
👎9🔥1
Media is too big
VIEW IN TELEGRAM
Moonvalley Marey
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
Новый видеогенератор
1. Натренирован не на ворованных видео (важно бизнесам, юзер больше пофик)
2. Много контроля: поза, перенос движения, траектории движения, образцы объектов, контроль камеры в 3D
3. Качество t2v на данный момент объективно похуже конкурентов
4. Нативная поддержка в CumfyUI
Бесплатного тарифа нет, приветственных кредитов не насыпают
Marey Realism v1.5 in ComfyUI
Спасибо @p0lygon
#text2video #comfyUI
👍3🤯3❤2