Notice: file_put_contents(): Write of 4561 bytes failed with errno=28 No space left on device in /var/www/group-telegram/post.php on line 50

Warning: file_put_contents(): Only 16384 of 20945 bytes written, possibly out of free disk space in /var/www/group-telegram/post.php on line 50
Все о блокчейн/мозге/space/WEB 3.0 в России и мире | Telegram Webview: blockchainRF/12276 -
Telegram Group & Telegram Channel
Андрей Карпатый: сегодняшние ИИ-агенты очень слабые, через ~10 лет агенты станут по-настоящему полезными для сложных задач.

Экс-директор по ИИ в Tesla и сооснователь OpenAI дал большое интервью, мы по частям разберем его в несколько постов. #часть1

Карпатый говорит, что сегодняшняя вера в агентов ведёт к горам плохого кода, уязвимостям и техдолгу. Цена ошибки в софте высока, как в автономном вождении. Нам нужны девятки надёжности: от 90% к 99.9% — это долгий путь.

Что не так с ИИ-агентами?

1. Ограниченный интеллект. Claude или Codex напоминают ему "детей-савантов" — отличная память, но слабое понимание контекста. Они справляются с шаблонными задачами, но проваливаются на уникальных или сложных проектах.

2. Отсутствие мультимодальности. Агенты пока не умеют полноценно взаимодействовать с компьютером, как человек — понимать интерфейсы, видеть экран, координировать действия.

3. Нет долговременной памяти. Каждый запрос — как новый старт. Модели не учатся на предыдущих взаимодействиях, сбрасывая контекст после каждой сессии.

4. Когнитивные пробелы. Им не хватает интуиции и гибкости для реальных задач.

Где агенты работают, а где — нет. Тестируя агентов на проекте nanochat, Карпатый выделил их сильные и слабые стороны:
1. Где хороши: шаблонный код, документация, работа с незнакомыми языками (например, Rust).
2. Где проваливаются: уникальный код, нестандартные решения, задачи, требующие глубокого понимания.

Проблемы:
- Непонимание контекста: модели предлагают стандартные решения, даже если вы объясняете, что нужно иное.
- Раздувание кода: лишние try-catch, избыточная сложность.
- Устаревшие знания: использование deprecated API, что требует ручной чистки.

Как Карпатый использует ИИ?
Он предпочитает автодополнение, где человек остаётся архитектором, а модель лишь ускоряет процесс. Это быстрее и надёжнее, чем vibe coding.

Чего он ждёт от агентов будущего?
- агенты должны объяснять код, доказывать его корректность, спрашивать, если не уверены.
- небольшие куски кода, которые легко понять и проверить.
- инструменты, которые помогают расти, а не просто выдают готовый код.
- модели должны учиться на взаимодействиях и сохранять контекст.
- агенты могли бы создавать задачи друг для друга, чтобы учиться и улучшаться.

Где заработют агента первыми? в call-центрах с чёткими задачами и закрытым контекстом, но даже там потребуется контроль людей.
👍196🔥3👏2🤔1🤣1🦄1



group-telegram.com/blockchainRF/12276
Create:
Last Update:

Андрей Карпатый: сегодняшние ИИ-агенты очень слабые, через ~10 лет агенты станут по-настоящему полезными для сложных задач.

Экс-директор по ИИ в Tesla и сооснователь OpenAI дал большое интервью, мы по частям разберем его в несколько постов. #часть1

Карпатый говорит, что сегодняшняя вера в агентов ведёт к горам плохого кода, уязвимостям и техдолгу. Цена ошибки в софте высока, как в автономном вождении. Нам нужны девятки надёжности: от 90% к 99.9% — это долгий путь.

Что не так с ИИ-агентами?

1. Ограниченный интеллект. Claude или Codex напоминают ему "детей-савантов" — отличная память, но слабое понимание контекста. Они справляются с шаблонными задачами, но проваливаются на уникальных или сложных проектах.

2. Отсутствие мультимодальности. Агенты пока не умеют полноценно взаимодействовать с компьютером, как человек — понимать интерфейсы, видеть экран, координировать действия.

3. Нет долговременной памяти. Каждый запрос — как новый старт. Модели не учатся на предыдущих взаимодействиях, сбрасывая контекст после каждой сессии.

4. Когнитивные пробелы. Им не хватает интуиции и гибкости для реальных задач.

Где агенты работают, а где — нет. Тестируя агентов на проекте nanochat, Карпатый выделил их сильные и слабые стороны:
1. Где хороши: шаблонный код, документация, работа с незнакомыми языками (например, Rust).
2. Где проваливаются: уникальный код, нестандартные решения, задачи, требующие глубокого понимания.

Проблемы:
- Непонимание контекста: модели предлагают стандартные решения, даже если вы объясняете, что нужно иное.
- Раздувание кода: лишние try-catch, избыточная сложность.
- Устаревшие знания: использование deprecated API, что требует ручной чистки.

Как Карпатый использует ИИ?
Он предпочитает автодополнение, где человек остаётся архитектором, а модель лишь ускоряет процесс. Это быстрее и надёжнее, чем vibe coding.

Чего он ждёт от агентов будущего?
- агенты должны объяснять код, доказывать его корректность, спрашивать, если не уверены.
- небольшие куски кода, которые легко понять и проверить.
- инструменты, которые помогают расти, а не просто выдают готовый код.
- модели должны учиться на взаимодействиях и сохранять контекст.
- агенты могли бы создавать задачи друг для друга, чтобы учиться и улучшаться.

Где заработют агента первыми? в call-центрах с чёткими задачами и закрытым контекстом, но даже там потребуется контроль людей.

BY Все о блокчейн/мозге/space/WEB 3.0 в России и мире




Share with your friend now:
group-telegram.com/blockchainRF/12276

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Perpetrators of such fraud use various marketing techniques to attract subscribers on their social media channels. Telegram has gained a reputation as the “secure” communications app in the post-Soviet states, but whenever you make choices about your digital security, it’s important to start by asking yourself, “What exactly am I securing? And who am I securing it from?” These questions should inform your decisions about whether you are using the right tool or platform for your digital security needs. Telegram is certainly not the most secure messaging app on the market right now. Its security model requires users to place a great deal of trust in Telegram’s ability to protect user data. For some users, this may be good enough for now. For others, it may be wiser to move to a different platform for certain kinds of high-risk communications. DFR Lab sent the image through Microsoft Azure's Face Verification program and found that it was "highly unlikely" that the person in the second photo was the same as the first woman. The fact-checker Logically AI also found the claim to be false. The woman, Olena Kurilo, was also captured in a video after the airstrike and shown to have the injuries. As such, the SC would like to remind investors to always exercise caution when evaluating investment opportunities, especially those promising unrealistically high returns with little or no risk. Investors should also never deposit money into someone’s personal bank account if instructed. "Russians are really disconnected from the reality of what happening to their country," Andrey said. "So Telegram has become essential for understanding what's going on to the Russian-speaking world."
from tw


Telegram Все о блокчейн/мозге/space/WEB 3.0 в России и мире
FROM American