Telegram Group Search
This media is not supported in your browser
VIEW IN TELEGRAM
‼️BTC = 100.000$

Сто тысяч мать его американских долларов за один гребный Bitcoin! 💰

📈Этот день войдет в историю.

05.11.2024
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
👨‍🏫Преобразования текста в видео с открытым исходным кодом от Tencent

📝Tencent только что выпустила свою видеомодель с открытым исходным кодом - Hunyuan Video с 13 миллиардами параметров.

Диапазон движений очень последовательный и естественный, угол камеры кажется большим, а камеру можно переключать вперед и назад.

Захват мимики также на месте, а общий вид получается очень плавным и естественным.

Особенности модели:

Супер реалистичная текстура

Высокая семантическая податливость

Плавное движущееся изображение

Преобразование объектива


Сайт проекта / Модель 💬
Please open Telegram to view this post
VIEW IN TELEGRAM
🆕Немного экономики.

Лучшие проекты ИИ по соотношению выручки к рыночной капитализации 📊
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Первая модель ИИ РЕАЛЬНОГО поколения для видеоигр

📱Компания Google DeepMind представила Genie 2 — модель базового мира, способную создавать бесконечное разнообразие управляемых действиями, играбельных 3D-сред для обучения и оценки воплощенных агентов. На основе одного изображения и подсказки.

От сцен реального мира от первого лица до автомобильных сред от третьего лица, Genie 2 генерирует миры в разрешении 720p.

Получив изображение, Genie 2 моделирует динамику мира, создавая согласованную среду, в которую можно играть с помощью клавиатуры и мыши.

Genie 2 также может улучшить дизайн окружения для людей, что позволяет вмешаться и играть с помощью концепт-арта.

Подробнее тут
💬
Please open Telegram to view this post
VIEW IN TELEGRAM
📱Google выпустила новую модель генерации видео — Veo и обновила генератор изображений — Imagen 3

🔵Veo создает видео на основе существующих или созданных искусственным интеллектом изображений.

🔵Veo использует изображения, созданные с помощью Imagen 3 или реальные изображения для создания коротких видеоклипов.

Imagen 3 это высококачественная модель преобразования текста в изображение. Она обеспечивает невероятный уровень детализации, создавая фотореалистичные, реалистичные изображения с гораздо меньшим количеством отвлекающих визуальных артефактов, чем наши предыдущие модели. 

И они решили 2 самых больших недостатка ИИ: пальцы и слезы.

Veo и Imagen 3 в закрытом предварительном просмотре на Vertex AI. 🎱

✍️ Подробнее тут
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление Runway

Act-One теперь позволяет транспонировать свои выступления непосредственно на персонажей в существующих видео. 🎩

♨️Это обновление выводит на новый уровень выразительность и контроль, открывая новые возможности использования профессиональных видеоконвейеров как в прямом эфире, так и в анимации.

С новыми видеороликами с референсами о персонажах теперь вы можете прослушивать новые реплики, кадры реакции и выразительные выступления без необходимости переснимать на натуре или со сложными настройками освещения. 🎶

Просто снимите новое выступление на свой телефон и используйте его для реанимации существующего материала. 🎵

тестить тут 🔋
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление Fish Audio 1.5 🆕

⭐️Огромные улучшения в точности, стабильности, межъязыковой компетенции и эмоциональном выражении с поддержкой пяти новых языков.

В скором времени появится функция бесшовного разговора в режиме реального времени, которая позволит пользователям выбирать голосовую библиотеку для интерактивного чата в любое время и в любом месте. ⭐️

🌟В Anonymous TTS-Arena заняла второе место

🕚Использует 1 миллион часов многоязычных обучающих данных

📍Доступно на 13 языках, включая русский, английский, китайский и японский.

👩‍💻Обеспечивает высококачественное мгновенное клонирование голоса с задержкой менее 150 мс.

Предварительно обученные модели имеют открытый исходный код, а также экономичные локальные или облачные варианты. 👨‍💻

демо / официальный сайт ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⭐️Обновления OpenAI

OpenAI продолжает работать над рендерингом Canvas для HTML-страниц. 👏

🧑‍💻Теперь он может бесшовно отображать HTML-страницы, а также имеет новую анимацию загрузки.

Эта функция все еще находится в разработке и недоступна для широкой публики. 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
⭐️ByteDance открыла инструмент точной синхронизации губ с открытым исходным кодом - LatentSync

Он может автоматически регулировать форму рта персонажа в видео на основе аудиовхода для достижения точной синхронизации губ.

🎙 Используйте звук для управления движениями рта, без необходимости выполнения сложных промежуточных шагов.

Технология «выравнивания по времени» предлагается специально для решения проблемы, связанной с тем, что изображение может прыгать или быть непоследовательным.🔍💡

🟢Он предоставляет полный набор инструментов для простой обработки видео и аудио, таких как регулировка частоты кадров, распознавание лиц и удаление видео низкого качества, чтобы гарантировать, что окончательно сгенерированное видео будет очень хорошим.

Модель на Гитхаб
Документация
Please open Telegram to view this post
VIEW IN TELEGRAM
🆕 Google выпустила официальный документ об агентах ИИ

В нем рассматриваются основы агентов llm и быстрая реализация Langchain.
🔄

5 ключевых выводов:


🔵Агенты — это искусственный интеллект на стероидах: они выходят за рамки базовых моделей, используя инструменты, составляя планы и предпринимая действия, что больше похоже на людей, решающих проблемы.

🔵Все дело в настройке: для работы агентам нужны три вещи: интеллектуальная модель для принятия решений, инструменты для взаимодействия с реальным миром и система для управления их планированием и действиями.

🔵Инструменты имеют решающее значение: API, базы данных и данные в режиме реального времени дают агентам сверхспособности, позволяющие им не просто отвечать на вопросы, но и действительно что-то делать.

🔵Еще многое предстоит сделать: прежде чем агенты действительно начнут работать, необходимо решить такие серьезные проблемы, как обеспечение простоты использования, взаимодействия и конфиденциальности.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 KLING сделали API с моделью AI 1.6

Из нового:

Более стабильные результаты: улучшенное следование подсказкам с движением

Более кинематографичные визуальные эффекты: улучшенная эстетика, цветопередача, освещение и детализация, предоставление высококачественных кадров по низкой цене

Расширяющие возможности продуктов для развлечений и искусственного интеллекта: более реалистичные и естественные результаты

✍️Клинг тут
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вышла новая модель синхронизации губ Sync

Lipsync-1.9 beta выглядит хорошо и синхронизация губ отличается высоким качеством.

Zero-shot learning без каких-либо обучающих данных может легко генерировать естественную речь в реальных видео, анимациях и видео, созданных ИИ, а также редактировать речь.

🎤 Тестить тут
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🆕 Mistral AI выпускает модель кода Codestral 25.01

Контекст этой модели до 256K. Баллы в нескольких тестах генерации кода были очень высокими, и LMsys copilot занял первое место.

В настоящее время он доступен бесплатно в плагине VS Code.

Подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
🆕Вышла новая модель от DeepSeek — R1

Модель почти в 2 раза мощнее предыдущей модели и доступна бесплатно.

Из интересного:

🔵Производительность на уровне OpenAI o1
🔵Модель с полностью открытым исходным кодом
🔵Лицензия MIT: пользоваться можно бесплатно в коммерческих целях
Веб-сайт и API уже доступны

Тестить тут 👾
✍️Гитхаб
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen выпустила Qwen Chat v0.2

Теперь вы можете изучать веб-поиск, создавать потрясающие видео и создавать изображения — и все это в Qwen Chat.📹

Изображение генерируется за пару секунд. Видео генерирует минут 5.
💥Все это доступно бесплатно.

Тестить тут ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
Kimi k1.5 теперь доступен в Интернете

По фактам:

Совершенно БЕСПЛАТНО с неограниченным использованием

Веб-поиск в режиме реального времени по 100+ веб-сайтам

С легкостью анализируйте до 50 файлов (PDF, Docs, PPT, изображения)

Расширенное мышление CoT, доступное бесплатно

Улучшенное понимание изображений, выходящее за рамки простого извлечения текста 👀

Тестить тут

Китайцы серьезно подошли к делу и бесплатным доступом сильно наступают на пятки гигантам. 🐾
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀DeepSeek возглавил чарты бесплатных iOS в США и Китае

Интересный кейс получился, хотя месяц назад, мы были уверены что OpenAI это непоколебимый лидер.

✍️Во-первых, они создали думающую модель всего за $6 млн (меньше, чем зарплата некоторых инженеров ИИ в Кремниевой долине, и 2% от стоимости ближайшего конкурента), которая не уступает OpenAI o1.

✍️Во-вторых, ребята вложили 0 $ в продвижение. Только качественный продукт, а дальше твиттер сообщество само все сделало.

✍️Во-третьих, есть ощущение, что OpenAI недооценили потенциал Deepseek и теперь спешно выкладывают свои передовые модели бесплатно. Например, Сэм заявил:

Выкатит бесплатный доступ к o3 mini
Выкатит агента Operator для тарифа Plus 🐈

Такие дела, выигрывает в такой конкуренции всегда пользователь. Что думаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
«Интернет погрузится во тьму»: ИИ-агенты имеют шансы заменить привычный интернет.

Об этом пишет Business Insider со ссылкой на аналитиков Bernstein.

Издание отмечает, что некоторые аналитики назвали 2025-й годом агентов ИИ – персонализированных цифровых помощников, которые могут взаимодействовать с пользователями, проводить исследования, собирать информацию, курировать контент и т.д.

Как утверждают аналитики Bernstein, «если агенты ИИ действительно станут полезными, интернет погрузится во тьму».

Веб-сайты и приложения не исчезнут, но потребители перестанут посещать их напрямую, поскольку будут получать доступ к информации, контенту и виджетам через помощника ИИ, который станет «агрегатором агрегаторов», говорят аналитики. Если агент ИИ сможет, например, вызвать такси, пользователям не понадобится открывать приложение для заказа поездки, утверждают они.

Агенты ИИ, представляющие пользователей, станут новым прямым каналом, который технологические компании будут использовать для связи с потребителями. Все остальные поставщики будут направляться через этот новый цифровой шлюз и, вероятно, должны будут платить какой-то сбор – так же, как Google зарабатывает на поисковой рекламе, а Apple – на комиссиях в App Store, пишет Business Insider.

Крупные технологические компании и стартапы уже сейчас сражаются за контроль над этим перспективным сегментом ИИ-рынка. В конце января OpenAI представила ИИ-агента Operator, который использует веб-браузер для выполнения действий от имени пользователей, например, бронирования билетов или покупки продуктов.

Ключевой момент заключается в том, что теперь взаимодействие идёт напрямую между ИИ-агентом и пользователем, тогда как раньше приходилось прибегать к поиску Google. В будущем Google может стать всего лишь одним из многих сервисов, доступных в экосистеме агентов ИИ, которую разрабатывает OpenAI.
2025/06/26 22:51:19
Back to Top
HTML Embed Code: