Telegram Group & Telegram Channel
Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.
5🔥5❤‍🔥4👏2👍1



group-telegram.com/blockchainRF/12473
Create:
Last Update:

Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/12473

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care. Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. The gold standard of encryption, known as end-to-end encryption, where only the sender and person who receives the message are able to see it, is available on Telegram only when the Secret Chat function is enabled. Voice and video calls are also completely encrypted. In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look.
from tw


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American