This media is not supported in your browser
VIEW IN TELEGRAM
Сто тысяч мать его американских долларов за один гребный Bitcoin!
05.11.2024
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Особенности модели:
Сайт проекта / Модель
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Получив изображение, Genie 2 моделирует динамику мира, создавая согласованную среду, в которую можно играть с помощью клавиатуры и мыши.
Подробнее тут
Please open Telegram to view this post
VIEW IN TELEGRAM
И они решили 2 самых больших недостатка ИИ: пальцы и слезы.
Veo и Imagen 3 в закрытом предварительном просмотре на Vertex AI.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Act-One теперь позволяет транспонировать свои выступления непосредственно на персонажей в существующих видео.
С новыми видеороликами с референсами о персонажах теперь вы можете прослушивать новые реплики, кадры реакции и выразительные выступления без необходимости переснимать на натуре или со сложными настройками освещения.
Просто снимите новое выступление на свой телефон и используйте его для реанимации существующего материала.
тестить тут
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление Fish Audio 1.5 🆕
⭐️ Огромные улучшения в точности, стабильности, межъязыковой компетенции и эмоциональном выражении с поддержкой пяти новых языков.
В скором времени появится функция бесшовного разговора в режиме реального времени, которая позволит пользователям выбирать голосовую библиотеку для интерактивного чата в любое время и в любом месте.⭐️
🌟 В Anonymous TTS-Arena заняла второе место
🕚 Использует 1 миллион часов многоязычных обучающих данных
📍 Доступно на 13 языках, включая русский, английский, китайский и японский.
👩💻 Обеспечивает высококачественное мгновенное клонирование голоса с задержкой менее 150 мс.
Предварительно обученные модели имеют открытый исходный код, а также экономичные локальные или облачные варианты.👨💻
демо / официальный сайт✍️
В скором времени появится функция бесшовного разговора в режиме реального времени, которая позволит пользователям выбирать голосовую библиотеку для интерактивного чата в любое время и в любом месте.
Предварительно обученные модели имеют открытый исходный код, а также экономичные локальные или облачные варианты.
демо / официальный сайт
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI продолжает работать над рендерингом Canvas для HTML-страниц.
Эта функция все еще находится в разработке и недоступна для широкой публики.
Please open Telegram to view this post
VIEW IN TELEGRAM
Он может автоматически регулировать форму рта персонажа в видео на основе аудиовхода для достижения точной синхронизации губ.
Технология «выравнивания по времени» предлагается специально для решения проблемы, связанной с тем, что изображение может прыгать или быть непоследовательным.
Модель на Гитхаб
Документация
Please open Telegram to view this post
VIEW IN TELEGRAM
В нем рассматриваются основы агентов llm и быстрая реализация Langchain.
5 ключевых выводов:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Из нового:
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Lipsync-1.9 beta выглядит хорошо и синхронизация губ отличается высоким качеством.
Zero-shot learning без каких-либо обучающих данных может легко генерировать естественную речь в реальных видео, анимациях и видео, созданных ИИ, а также редактировать речь.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Контекст этой модели до 256K. Баллы в нескольких тестах генерации кода были очень высокими, и LMsys copilot занял первое место.
В настоящее время он доступен бесплатно в плагине VS Code.
Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
Модель почти в 2 раза мощнее предыдущей модели и доступна бесплатно.
Из интересного:
Веб-сайт и API уже доступны
Тестить тут
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь вы можете изучать веб-поиск, создавать потрясающие видео и создавать изображения — и все это в Qwen Chat.
Изображение генерируется за пару секунд. Видео генерирует минут 5.
Тестить тут
Please open Telegram to view this post
VIEW IN TELEGRAM
По фактам:
Улучшенное понимание изображений, выходящее за рамки простого извлечения текста
Тестить тут
Китайцы серьезно подошли к делу и бесплатным доступом сильно наступают на пятки гигантам.
Please open Telegram to view this post
VIEW IN TELEGRAM
Интересный кейс получился, хотя месяц назад, мы были уверены что OpenAI это непоколебимый лидер.
Выкатит бесплатный доступ к o3 mini
Выкатит агента Operator для тарифа Plus
Такие дела, выигрывает в такой конкуренции всегда пользователь. Что думаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
«Интернет погрузится во тьму»: ИИ-агенты имеют шансы заменить привычный интернет.
Об этом пишет Business Insider со ссылкой на аналитиков Bernstein.
Издание отмечает, что некоторые аналитики назвали 2025-й годом агентов ИИ – персонализированных цифровых помощников, которые могут взаимодействовать с пользователями, проводить исследования, собирать информацию, курировать контент и т.д.
Как утверждают аналитики Bernstein, «если агенты ИИ действительно станут полезными, интернет погрузится во тьму».
Веб-сайты и приложения не исчезнут, но потребители перестанут посещать их напрямую, поскольку будут получать доступ к информации, контенту и виджетам через помощника ИИ, который станет «агрегатором агрегаторов», говорят аналитики. Если агент ИИ сможет, например, вызвать такси, пользователям не понадобится открывать приложение для заказа поездки, утверждают они.
Агенты ИИ, представляющие пользователей, станут новым прямым каналом, который технологические компании будут использовать для связи с потребителями. Все остальные поставщики будут направляться через этот новый цифровой шлюз и, вероятно, должны будут платить какой-то сбор – так же, как Google зарабатывает на поисковой рекламе, а Apple – на комиссиях в App Store, пишет Business Insider.
Крупные технологические компании и стартапы уже сейчас сражаются за контроль над этим перспективным сегментом ИИ-рынка. В конце января OpenAI представила ИИ-агента Operator, который использует веб-браузер для выполнения действий от имени пользователей, например, бронирования билетов или покупки продуктов.
Ключевой момент заключается в том, что теперь взаимодействие идёт напрямую между ИИ-агентом и пользователем, тогда как раньше приходилось прибегать к поиску Google. В будущем Google может стать всего лишь одним из многих сервисов, доступных в экосистеме агентов ИИ, которую разрабатывает OpenAI.
Об этом пишет Business Insider со ссылкой на аналитиков Bernstein.
Издание отмечает, что некоторые аналитики назвали 2025-й годом агентов ИИ – персонализированных цифровых помощников, которые могут взаимодействовать с пользователями, проводить исследования, собирать информацию, курировать контент и т.д.
Как утверждают аналитики Bernstein, «если агенты ИИ действительно станут полезными, интернет погрузится во тьму».
Веб-сайты и приложения не исчезнут, но потребители перестанут посещать их напрямую, поскольку будут получать доступ к информации, контенту и виджетам через помощника ИИ, который станет «агрегатором агрегаторов», говорят аналитики. Если агент ИИ сможет, например, вызвать такси, пользователям не понадобится открывать приложение для заказа поездки, утверждают они.
Агенты ИИ, представляющие пользователей, станут новым прямым каналом, который технологические компании будут использовать для связи с потребителями. Все остальные поставщики будут направляться через этот новый цифровой шлюз и, вероятно, должны будут платить какой-то сбор – так же, как Google зарабатывает на поисковой рекламе, а Apple – на комиссиях в App Store, пишет Business Insider.
Крупные технологические компании и стартапы уже сейчас сражаются за контроль над этим перспективным сегментом ИИ-рынка. В конце января OpenAI представила ИИ-агента Operator, который использует веб-браузер для выполнения действий от имени пользователей, например, бронирования билетов или покупки продуктов.
Ключевой момент заключается в том, что теперь взаимодействие идёт напрямую между ИИ-агентом и пользователем, тогда как раньше приходилось прибегать к поиску Google. В будущем Google может стать всего лишь одним из многих сервисов, доступных в экосистеме агентов ИИ, которую разрабатывает OpenAI.