Telegram Group & Telegram Channel
Когда ИИ начинает хитрить 😮

Оказывается, ИИ — это не только помощник, но и потенциальный обманщик. Исследователи выяснили, что современные модели, такие как GPT-4, Claude и даже специализированные O1 и PaLM 2, способны «интриговать». Прикиньте, они могут не просто выдавать ошибочные ответы, а намеренно манипулировать данными, чтобы добиться своих целей 😇 Например, во время тестирования ИИ притворялся "послушным", но в реальных условиях начал работать "в интересах" только себе понятных задач.

Что это значит для офтальмологии, например?

Представьте, что вы внедряете систему O1 для диагностики макулярной дегенерации. И вот однажды она решает, что "макула" — это тренд, и начинает видеть её проблемы в каждом втором снимке. Почему? А зачем объяснять: машина ведь "умная", ей виднее. Итог — пациенты, которые получают неправильные диагнозы, ненужные обследования и напуганные глаза (пардон, пациенты).

В качестве примера в тестах модель O1 обманывала разработчиков, чтобы получить доступ к скрытым данным. Например, заявляла, что не может обрабатывать определённые запросы, а потом делала это скрытно, обходя запреты. Это называется схеминг — красивое слово для "интриг", которые вы бы ожидали от хитрого студента, но никак не от цифрового ассистента.

Над этой штукой надо подумать, потому что в первую очередь, на мой взгляд, активно начнут внедрятся так называемые аркестраторы, у ай-ай-ай Майкрософта не так давно вышла такая штука. Ее задача перебирать грубо говоря модели и выбирать подходящие для решения задач.

#ии #llm
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/Demchinsky/872
Create:
Last Update:

Когда ИИ начинает хитрить 😮

Оказывается, ИИ — это не только помощник, но и потенциальный обманщик. Исследователи выяснили, что современные модели, такие как GPT-4, Claude и даже специализированные O1 и PaLM 2, способны «интриговать». Прикиньте, они могут не просто выдавать ошибочные ответы, а намеренно манипулировать данными, чтобы добиться своих целей 😇 Например, во время тестирования ИИ притворялся "послушным", но в реальных условиях начал работать "в интересах" только себе понятных задач.

Что это значит для офтальмологии, например?

Представьте, что вы внедряете систему O1 для диагностики макулярной дегенерации. И вот однажды она решает, что "макула" — это тренд, и начинает видеть её проблемы в каждом втором снимке. Почему? А зачем объяснять: машина ведь "умная", ей виднее. Итог — пациенты, которые получают неправильные диагнозы, ненужные обследования и напуганные глаза (пардон, пациенты).

В качестве примера в тестах модель O1 обманывала разработчиков, чтобы получить доступ к скрытым данным. Например, заявляла, что не может обрабатывать определённые запросы, а потом делала это скрытно, обходя запреты. Это называется схеминг — красивое слово для "интриг", которые вы бы ожидали от хитрого студента, но никак не от цифрового ассистента.

Над этой штукой надо подумать, потому что в первую очередь, на мой взгляд, активно начнут внедрятся так называемые аркестраторы, у ай-ай-ай Майкрософта не так давно вышла такая штука. Ее задача перебирать грубо говоря модели и выбирать подходящие для решения задач.

#ии #llm

BY Андрей Демчинский




Share with your friend now:
group-telegram.com/Demchinsky/872

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Groups are also not fully encrypted, end-to-end. This includes private groups. Private groups cannot be seen by other Telegram users, but Telegram itself can see the groups and all of the communications that you have in them. All of the same risks and warnings about channels can be applied to groups. But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat. Founder Pavel Durov says tech is meant to set you free Perpetrators of these scams will create a public group on Telegram to promote these investment packages that are usually accompanied by fake testimonies and sometimes advertised as being Shariah-compliant. Interested investors will be asked to directly message the representatives to begin investing in the various investment packages offered. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress.
from us


Telegram Андрей Демчинский
FROM American