Telegram Group & Telegram Channel
Андрей Карпатый: сегодняшние ИИ-агенты очень слабые, через ~10 лет агенты станут по-настоящему полезными для сложных задач.

Экс-директор по ИИ в Tesla и сооснователь OpenAI дал большое интервью, мы по частям разберем его в несколько постов. #часть1

Карпатый говорит, что сегодняшняя вера в агентов ведёт к горам плохого кода, уязвимостям и техдолгу. Цена ошибки в софте высока, как в автономном вождении. Нам нужны девятки надёжности: от 90% к 99.9% — это долгий путь.

Что не так с ИИ-агентами?

1. Ограниченный интеллект. Claude или Codex напоминают ему "детей-савантов" — отличная память, но слабое понимание контекста. Они справляются с шаблонными задачами, но проваливаются на уникальных или сложных проектах.

2. Отсутствие мультимодальности. Агенты пока не умеют полноценно взаимодействовать с компьютером, как человек — понимать интерфейсы, видеть экран, координировать действия.

3. Нет долговременной памяти. Каждый запрос — как новый старт. Модели не учатся на предыдущих взаимодействиях, сбрасывая контекст после каждой сессии.

4. Когнитивные пробелы. Им не хватает интуиции и гибкости для реальных задач.

Где агенты работают, а где — нет. Тестируя агентов на проекте nanochat, Карпатый выделил их сильные и слабые стороны:
1. Где хороши: шаблонный код, документация, работа с незнакомыми языками (например, Rust).
2. Где проваливаются: уникальный код, нестандартные решения, задачи, требующие глубокого понимания.

Проблемы:
- Непонимание контекста: модели предлагают стандартные решения, даже если вы объясняете, что нужно иное.
- Раздувание кода: лишние try-catch, избыточная сложность.
- Устаревшие знания: использование deprecated API, что требует ручной чистки.

Как Карпатый использует ИИ?
Он предпочитает автодополнение, где человек остаётся архитектором, а модель лишь ускоряет процесс. Это быстрее и надёжнее, чем vibe coding.

Чего он ждёт от агентов будущего?
- агенты должны объяснять код, доказывать его корректность, спрашивать, если не уверены.
- небольшие куски кода, которые легко понять и проверить.
- инструменты, которые помогают расти, а не просто выдают готовый код.
- модели должны учиться на взаимодействиях и сохранять контекст.
- агенты могли бы создавать задачи друг для друга, чтобы учиться и улучшаться.

Где заработют агента первыми? в call-центрах с чёткими задачами и закрытым контекстом, но даже там потребуется контроль людей.
👍186🔥3👏2🤔1🤣1🦄1



group-telegram.com/blockchainRF/12276
Create:
Last Update:

Андрей Карпатый: сегодняшние ИИ-агенты очень слабые, через ~10 лет агенты станут по-настоящему полезными для сложных задач.

Экс-директор по ИИ в Tesla и сооснователь OpenAI дал большое интервью, мы по частям разберем его в несколько постов. #часть1

Карпатый говорит, что сегодняшняя вера в агентов ведёт к горам плохого кода, уязвимостям и техдолгу. Цена ошибки в софте высока, как в автономном вождении. Нам нужны девятки надёжности: от 90% к 99.9% — это долгий путь.

Что не так с ИИ-агентами?

1. Ограниченный интеллект. Claude или Codex напоминают ему "детей-савантов" — отличная память, но слабое понимание контекста. Они справляются с шаблонными задачами, но проваливаются на уникальных или сложных проектах.

2. Отсутствие мультимодальности. Агенты пока не умеют полноценно взаимодействовать с компьютером, как человек — понимать интерфейсы, видеть экран, координировать действия.

3. Нет долговременной памяти. Каждый запрос — как новый старт. Модели не учатся на предыдущих взаимодействиях, сбрасывая контекст после каждой сессии.

4. Когнитивные пробелы. Им не хватает интуиции и гибкости для реальных задач.

Где агенты работают, а где — нет. Тестируя агентов на проекте nanochat, Карпатый выделил их сильные и слабые стороны:
1. Где хороши: шаблонный код, документация, работа с незнакомыми языками (например, Rust).
2. Где проваливаются: уникальный код, нестандартные решения, задачи, требующие глубокого понимания.

Проблемы:
- Непонимание контекста: модели предлагают стандартные решения, даже если вы объясняете, что нужно иное.
- Раздувание кода: лишние try-catch, избыточная сложность.
- Устаревшие знания: использование deprecated API, что требует ручной чистки.

Как Карпатый использует ИИ?
Он предпочитает автодополнение, где человек остаётся архитектором, а модель лишь ускоряет процесс. Это быстрее и надёжнее, чем vibe coding.

Чего он ждёт от агентов будущего?
- агенты должны объяснять код, доказывать его корректность, спрашивать, если не уверены.
- небольшие куски кода, которые легко понять и проверить.
- инструменты, которые помогают расти, а не просто выдают готовый код.
- модели должны учиться на взаимодействиях и сохранять контекст.
- агенты могли бы создавать задачи друг для друга, чтобы учиться и улучшаться.

Где заработют агента первыми? в call-центрах с чёткими задачами и закрытым контекстом, но даже там потребуется контроль людей.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/12276

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The company maintains that it cannot act against individual or group chats, which are “private amongst their participants,” but it will respond to requests in relation to sticker sets, channels and bots which are publicly available. During the invasion of Ukraine, Pavel Durov has wrestled with this issue a lot more prominently than he has before. Channels like Donbass Insider and Bellum Acta, as reported by Foreign Policy, started pumping out pro-Russian propaganda as the invasion began. So much so that the Ukrainian National Security and Defense Council issued a statement labeling which accounts are Russian-backed. Ukrainian officials, in potential violation of the Geneva Convention, have shared imagery of dead and captured Russian soldiers on the platform. The War on Fakes channel has repeatedly attempted to push conspiracies that footage from Ukraine is somehow being falsified. One post on the channel from February 24 claimed without evidence that a widely viewed photo of a Ukrainian woman injured in an airstrike in the city of Chuhuiv was doctored and that the woman was seen in a different photo days later without injuries. The post, which has over 600,000 views, also baselessly claimed that the woman's blood was actually makeup or grape juice. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. On Feb. 27, however, he admitted from his Russian-language account that "Telegram channels are increasingly becoming a source of unverified information related to Ukrainian events." Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts.
from us


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American