Telegram Group & Telegram Channel
Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.
5🔥5❤‍🔥4👏2👍1



group-telegram.com/blockchainRF/12473
Create:
Last Update:

Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/12473

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores. Update March 8, 2022: EFF has clarified that Channels and Groups are not fully encrypted, end-to-end, updated our post to link to Telegram’s FAQ for Cloud and Secret chats, updated to clarify that auto-delete is available for group and channel admins, and added some additional links. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. For Oleksandra Tsekhanovska, head of the Hybrid Warfare Analytical Group at the Kyiv-based Ukraine Crisis Media Center, the effects are both near- and far-reaching. Ukrainian forces have since put up a strong resistance to the Russian troops amid the war that has left hundreds of Ukrainian civilians, including children, dead, according to the United Nations. Ukrainian and international officials have accused Russia of targeting civilian populations with shelling and bombardments.
from sg


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American