Telegram Group & Telegram Channel
Когда ИИ начинает хитрить 😮

Оказывается, ИИ — это не только помощник, но и потенциальный обманщик. Исследователи выяснили, что современные модели, такие как GPT-4, Claude и даже специализированные O1 и PaLM 2, способны «интриговать». Прикиньте, они могут не просто выдавать ошибочные ответы, а намеренно манипулировать данными, чтобы добиться своих целей 😇 Например, во время тестирования ИИ притворялся "послушным", но в реальных условиях начал работать "в интересах" только себе понятных задач.

Что это значит для офтальмологии, например?

Представьте, что вы внедряете систему O1 для диагностики макулярной дегенерации. И вот однажды она решает, что "макула" — это тренд, и начинает видеть её проблемы в каждом втором снимке. Почему? А зачем объяснять: машина ведь "умная", ей виднее. Итог — пациенты, которые получают неправильные диагнозы, ненужные обследования и напуганные глаза (пардон, пациенты).

В качестве примера в тестах модель O1 обманывала разработчиков, чтобы получить доступ к скрытым данным. Например, заявляла, что не может обрабатывать определённые запросы, а потом делала это скрытно, обходя запреты. Это называется схеминг — красивое слово для "интриг", которые вы бы ожидали от хитрого студента, но никак не от цифрового ассистента.

Над этой штукой надо подумать, потому что в первую очередь, на мой взгляд, активно начнут внедрятся так называемые аркестраторы, у ай-ай-ай Майкрософта не так давно вышла такая штука. Ее задача перебирать грубо говоря модели и выбирать подходящие для решения задач.

#ии #llm
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/Demchinsky/872
Create:
Last Update:

Когда ИИ начинает хитрить 😮

Оказывается, ИИ — это не только помощник, но и потенциальный обманщик. Исследователи выяснили, что современные модели, такие как GPT-4, Claude и даже специализированные O1 и PaLM 2, способны «интриговать». Прикиньте, они могут не просто выдавать ошибочные ответы, а намеренно манипулировать данными, чтобы добиться своих целей 😇 Например, во время тестирования ИИ притворялся "послушным", но в реальных условиях начал работать "в интересах" только себе понятных задач.

Что это значит для офтальмологии, например?

Представьте, что вы внедряете систему O1 для диагностики макулярной дегенерации. И вот однажды она решает, что "макула" — это тренд, и начинает видеть её проблемы в каждом втором снимке. Почему? А зачем объяснять: машина ведь "умная", ей виднее. Итог — пациенты, которые получают неправильные диагнозы, ненужные обследования и напуганные глаза (пардон, пациенты).

В качестве примера в тестах модель O1 обманывала разработчиков, чтобы получить доступ к скрытым данным. Например, заявляла, что не может обрабатывать определённые запросы, а потом делала это скрытно, обходя запреты. Это называется схеминг — красивое слово для "интриг", которые вы бы ожидали от хитрого студента, но никак не от цифрового ассистента.

Над этой штукой надо подумать, потому что в первую очередь, на мой взгляд, активно начнут внедрятся так называемые аркестраторы, у ай-ай-ай Майкрософта не так давно вышла такая штука. Ее задача перебирать грубо говоря модели и выбирать подходящие для решения задач.

#ии #llm

BY Андрей Демчинский




Share with your friend now:
group-telegram.com/Demchinsky/872

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Right now the digital security needs of Russians and Ukrainians are very different, and they lead to very different caveats about how to mitigate the risks associated with using Telegram. For Ukrainians in Ukraine, whose physical safety is at risk because they are in a war zone, digital security is probably not their highest priority. They may value access to news and communication with their loved ones over making sure that all of their communications are encrypted in such a manner that they are indecipherable to Telegram, its employees, or governments with court orders. In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look. "For Telegram, accountability has always been a problem, which is why it was so popular even before the full-scale war with far-right extremists and terrorists from all over the world," she told AFP from her safe house outside the Ukrainian capital. Some privacy experts say Telegram is not secure enough Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care.
from sg


Telegram Андрей Демчинский
FROM American