Telegram Group & Telegram Channel
Почему ИИ-агенты пока не работают в реальности?

ИИ-агенты — горячая тема уже давно, начиная от генерации кода до создания текстов и изображений, они обещают революцию.

Но за хайпом стоит серьезная проблема, о которой говорят эксперты вроде Андрея Карпати, со-основателя OpenAI, и Баладжи Сринивасана в недавних обсуждениях на X.

Проблема в том, что ИИ отлично справляется с быстрой генерацией контента, но проверка результатов — настоящий камень преткновения.

Пользователи отмечают, что до 90% времени работы с ИИ уходит на проверку его выводов.

Люди тратят больше времени на проверку кода, созданного ИИ, чем на промпты. 90% работы с ИИ-агентами — это проверка результатов, говорят пользователи.

Почему генерация легкая?

- Изображения можно быстро оценить визуально.
- Простой код проверяется по шаблонам.
- Модели опираются на паттерны из огромных обучающих данных.

Почему верификация сложная?

1. Требует глубокого понимания предметной области, например, медицина, финансы, наука.
2. Нужны логические рассуждения, а не только распознавание паттернов.
3. Текущие модели, вроде трансформеров, оптимизированы для предсказания, а не для проверки фактов или логики.
4. Верификация требует более сложных моделей, способных к рассуждению, а не только к генерации.
5. В критических областях нет надежных эталонных данных для автоматической верификации.

Карпати называет это "verification gap" — новым узким местом ИИ после решения проблемы скорости генерации. Без надежной верификации ИИ-агенты остаются инструментами, требующими постоянного надзора, особенно в медицине, финансах и научных исследованиях.

Исследователи работают над решениями:

- Обучение с обратной связью (RLHF) для улучшения проверки.
- Специализированные модели для факт-чекинга и дебаггинга кода.
- Интеграция с внешними инструментами, такими как симуляторы или базы данных.

Пока verification gap не закрыт, ИИ-агенты — это мощный, но не автономный инструмент. Хайп вокруг них оправдан, но реальность требует трезвого взгляда.



group-telegram.com/agirussianews/2021
Create:
Last Update:

Почему ИИ-агенты пока не работают в реальности?

ИИ-агенты — горячая тема уже давно, начиная от генерации кода до создания текстов и изображений, они обещают революцию.

Но за хайпом стоит серьезная проблема, о которой говорят эксперты вроде Андрея Карпати, со-основателя OpenAI, и Баладжи Сринивасана в недавних обсуждениях на X.

Проблема в том, что ИИ отлично справляется с быстрой генерацией контента, но проверка результатов — настоящий камень преткновения.

Пользователи отмечают, что до 90% времени работы с ИИ уходит на проверку его выводов.

Люди тратят больше времени на проверку кода, созданного ИИ, чем на промпты. 90% работы с ИИ-агентами — это проверка результатов, говорят пользователи.

Почему генерация легкая?

- Изображения можно быстро оценить визуально.
- Простой код проверяется по шаблонам.
- Модели опираются на паттерны из огромных обучающих данных.

Почему верификация сложная?

1. Требует глубокого понимания предметной области, например, медицина, финансы, наука.
2. Нужны логические рассуждения, а не только распознавание паттернов.
3. Текущие модели, вроде трансформеров, оптимизированы для предсказания, а не для проверки фактов или логики.
4. Верификация требует более сложных моделей, способных к рассуждению, а не только к генерации.
5. В критических областях нет надежных эталонных данных для автоматической верификации.

Карпати называет это "verification gap" — новым узким местом ИИ после решения проблемы скорости генерации. Без надежной верификации ИИ-агенты остаются инструментами, требующими постоянного надзора, особенно в медицине, финансах и научных исследованиях.

Исследователи работают над решениями:

- Обучение с обратной связью (RLHF) для улучшения проверки.
- Специализированные модели для факт-чекинга и дебаггинга кода.
- Интеграция с внешними инструментами, такими как симуляторы или базы данных.

Пока verification gap не закрыт, ИИ-агенты — это мощный, но не автономный инструмент. Хайп вокруг них оправдан, но реальность требует трезвого взгляда.

BY AGIRussia.news


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/agirussianews/2021

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Either way, Durov says that he withdrew his resignation but that he was ousted from his company anyway. Subsequently, control of the company was reportedly handed to oligarchs Alisher Usmanov and Igor Sechin, both allegedly close associates of Russian leader Vladimir Putin. "There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. DFR Lab sent the image through Microsoft Azure's Face Verification program and found that it was "highly unlikely" that the person in the second photo was the same as the first woman. The fact-checker Logically AI also found the claim to be false. The woman, Olena Kurilo, was also captured in a video after the airstrike and shown to have the injuries. Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities. Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores.
from sg


Telegram AGIRussia.news
FROM American