Telegram Group & Telegram Channel
Почему ИИ-агенты пока не работают в реальности?

ИИ-агенты — горячая тема уже давно, начиная от генерации кода до создания текстов и изображений, они обещают революцию.

Но за хайпом стоит серьезная проблема, о которой говорят эксперты вроде Андрея Карпати, со-основателя OpenAI, и Баладжи Сринивасана в недавних обсуждениях на X.

Проблема в том, что ИИ отлично справляется с быстрой генерацией контента, но проверка результатов — настоящий камень преткновения.

Пользователи отмечают, что до 90% времени работы с ИИ уходит на проверку его выводов.

Люди тратят больше времени на проверку кода, созданного ИИ, чем на промпты. 90% работы с ИИ-агентами — это проверка результатов, говорят пользователи.

Почему генерация легкая?

- Изображения можно быстро оценить визуально.
- Простой код проверяется по шаблонам.
- Модели опираются на паттерны из огромных обучающих данных.

Почему верификация сложная?

1. Требует глубокого понимания предметной области, например, медицина, финансы, наука.
2. Нужны логические рассуждения, а не только распознавание паттернов.
3. Текущие модели, вроде трансформеров, оптимизированы для предсказания, а не для проверки фактов или логики.
4. Верификация требует более сложных моделей, способных к рассуждению, а не только к генерации.
5. В критических областях нет надежных эталонных данных для автоматической верификации.

Карпати называет это "verification gap" — новым узким местом ИИ после решения проблемы скорости генерации. Без надежной верификации ИИ-агенты остаются инструментами, требующими постоянного надзора, особенно в медицине, финансах и научных исследованиях.

Исследователи работают над решениями:

- Обучение с обратной связью (RLHF) для улучшения проверки.
- Специализированные модели для факт-чекинга и дебаггинга кода.
- Интеграция с внешними инструментами, такими как симуляторы или базы данных.

Пока verification gap не закрыт, ИИ-агенты — это мощный, но не автономный инструмент. Хайп вокруг них оправдан, но реальность требует трезвого взгляда.



group-telegram.com/agirussianews/2021
Create:
Last Update:

Почему ИИ-агенты пока не работают в реальности?

ИИ-агенты — горячая тема уже давно, начиная от генерации кода до создания текстов и изображений, они обещают революцию.

Но за хайпом стоит серьезная проблема, о которой говорят эксперты вроде Андрея Карпати, со-основателя OpenAI, и Баладжи Сринивасана в недавних обсуждениях на X.

Проблема в том, что ИИ отлично справляется с быстрой генерацией контента, но проверка результатов — настоящий камень преткновения.

Пользователи отмечают, что до 90% времени работы с ИИ уходит на проверку его выводов.

Люди тратят больше времени на проверку кода, созданного ИИ, чем на промпты. 90% работы с ИИ-агентами — это проверка результатов, говорят пользователи.

Почему генерация легкая?

- Изображения можно быстро оценить визуально.
- Простой код проверяется по шаблонам.
- Модели опираются на паттерны из огромных обучающих данных.

Почему верификация сложная?

1. Требует глубокого понимания предметной области, например, медицина, финансы, наука.
2. Нужны логические рассуждения, а не только распознавание паттернов.
3. Текущие модели, вроде трансформеров, оптимизированы для предсказания, а не для проверки фактов или логики.
4. Верификация требует более сложных моделей, способных к рассуждению, а не только к генерации.
5. В критических областях нет надежных эталонных данных для автоматической верификации.

Карпати называет это "verification gap" — новым узким местом ИИ после решения проблемы скорости генерации. Без надежной верификации ИИ-агенты остаются инструментами, требующими постоянного надзора, особенно в медицине, финансах и научных исследованиях.

Исследователи работают над решениями:

- Обучение с обратной связью (RLHF) для улучшения проверки.
- Специализированные модели для факт-чекинга и дебаггинга кода.
- Интеграция с внешними инструментами, такими как симуляторы или базы данных.

Пока verification gap не закрыт, ИИ-агенты — это мощный, но не автономный инструмент. Хайп вокруг них оправдан, но реальность требует трезвого взгляда.

BY AGIRussia.news


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/agirussianews/2021

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Ukrainian President Volodymyr Zelensky said in a video message on Tuesday that Ukrainian forces "destroy the invaders wherever we can." If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats. Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care. Pavel Durov, a billionaire who embraces an all-black wardrobe and is often compared to the character Neo from "the Matrix," funds Telegram through his personal wealth and debt financing. And despite being one of the world's most popular tech companies, Telegram reportedly has only about 30 employees who defer to Durov for most major decisions about the platform.
from ua


Telegram AGIRussia.news
FROM American