Telegram Group & Telegram Channel
Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.
🔥5❤‍🔥4👏2👍1



group-telegram.com/blockchainRF/12473
Create:
Last Update:

Google выпустил статью об агенте, способному к самообучению и в этой статье указан Демис Хассабис

Google DeepMind опубликовали статью о SIMA 2 — воплощенном ИИ-агенте для виртуальных миров. Это новая архитектура, решающая критическую проблему адаптации больших языковых моделей для embodied AI.

В основе SIMA 2 лежит Gemini Flash-Lite, обученная на смешанных данных: геймплей + Gemini reasoning. Ключевая инновация — агент сохраняет базовые способности foundation model при специализации на воплощенные задачи.

Методология обучения - 2-х уровневая система данных:

1. Human data: траектории из 10+ игровых сред, собранные через "Setter-Solver" методологию — один участник управляет аватаром, второй дает инструкции. Это создает каузальную связь язык→действие.

2. Bridge data: Gemini Pro генерирует внутренний reasoning и диалог для синхронизации с визуальным вводом. Агент учится не просто действовать, но и объяснять свои действия.

Ключевая инновация - Self-Improvement. DeepMind реализовали замкнутый цикл самообучения. Компоненты:
Gemini-based Task Setter — генерирует задачи из текущего состояния среды
Gemini-based Reward Model — оценивает траектории по 100-балльной рубрике
RL training на self-generated experience
ASKA эксперимент:
- С каждой итерацией performance улучшается
- В некоторых задачах превосходит human reference trajectories.
Агент автономно осваивает навыки типа "extinguish campfire"

Genie 3 эксперимент:
Train: urban environments, Test: natural environments
Self-improvement на urban tasks → +25 points на большинстве задач.

Агент учится в любом типе среды, используя neural network как universal world model.

Эта система может автономно генерировать опыт, оценивать его и улучшаться в бесконечно разнообразных окружениях.
DeepMind позиционирует это как шаг к general-purpose interactive agents.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/12473

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Two days after Russia invaded Ukraine, an account on the Telegram messaging platform posing as President Volodymyr Zelenskiy urged his armed forces to surrender. Continuing its crackdown against entities allegedly involved in a front-running scam using messaging app Telegram, Sebi on Thursday carried out search and seizure operations at the premises of eight entities in multiple locations across the country. "The inflation fire was already hot and now with war-driven inflation added to the mix, it will grow even hotter, setting off a scramble by the world’s central banks to pull back their stimulus earlier than expected," Chris Rupkey, chief economist at FWDBONDS, wrote in an email. "A spike in inflation rates has preceded economic recessions historically and this time prices have soared to levels that once again pose a threat to growth." Meanwhile, a completely redesigned attachment menu appears when sending multiple photos or vides. Users can tap "X selected" (X being the number of items) at the top of the panel to preview how the album will look in the chat when it's sent, as well as rearrange or remove selected media. The picture was mixed overseas. Hong Kong’s Hang Seng Index fell 1.6%, under pressure from U.S. regulatory scrutiny on New York-listed Chinese companies. Stocks were more buoyant in Europe, where Frankfurt’s DAX surged 1.4%.
from kr


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American