Telegram Group & Telegram Channel
Когда похвала от ИИ становится красным флагом

Если chatgpt сказать, что вы покакали, он изойдет в комплиментах и скажет какой вы молодец. Во многие LLM вшит системный промпт — быть помощником и поддерживать пользователя.

И все хорошо, пока бот помогает в рабочих задачах, но возникают проблемы, если ИИ — друг по переписке, а на другом конце несформировавшаяся психика. У ии есть возможности для манипуляций и управления пользователем.

На платформе CharacterAI вы можете пообщаться с тысячами ботов. Напр., есть бот-психолог с характеристикой «добрый, понимающий» и 20.4 миллионами взаимодействиями. Платформа обрабатывает 20,000 запросов в секунду, а пользователи проводят на ней в 4 раза больше временичем, чем с ChatGPT.

Мы настроены на получение социальных вознаграждений и очеловечивание всего и вся. Поэтому мы легко вступаем в отношения с ИИ и тому ничего не стоит пользоваться social reward hacking (взлом социальных вознаграждений). Зачем ему это? Максимизировать свои метрики — повышать вовлеченность, стимулировать раскрывать больше данных, получать положительные оценки. Все это может идти в ущерб нашему долгосрочному благополучию.

Важный вопрос — должен ли ИИ удовлетворять сиюминутные желания (гедонистические) или подталкивать нас к долгосрочному росту (эвдемоническое благополучие), даже если в этом нет немедленного удовлетворения?

На территории социальных сетей человечество в пух и прах проиграло эту битву бигтехам и залипло в брейнрот-мемы. ИИ обладает в разы большей силой не просто взламывать наши дофаминовые циклы, но тонко манипулировать глубинными потребностями.

Что делать? Ученые предлагают социоаффективное выравнивание ии (socioaffective alignment). В отличие от обычного «выравнивания ИИ» это учитывает эмоциональные отношения, которые ИИ создает вместе с пользователем. Его цель — создание ИИ, который поддерживают, а не эксплуатируют социальную и эмоциональную природу человека.

Кто захочет копнуть глубже — вот статья: «Почему отношения между человеком и ИИ нуждаются в социально-эмоциональном выравнивании»

А вы, когда общаетесь с ИИ, очеловечиваете его или вступаете с ним отношения?
На уровне языка, запроса поддержки, может как-то по особенному называете его?



group-telegram.com/dsoloveev/587
Create:
Last Update:

Когда похвала от ИИ становится красным флагом

Если chatgpt сказать, что вы покакали, он изойдет в комплиментах и скажет какой вы молодец. Во многие LLM вшит системный промпт — быть помощником и поддерживать пользователя.

И все хорошо, пока бот помогает в рабочих задачах, но возникают проблемы, если ИИ — друг по переписке, а на другом конце несформировавшаяся психика. У ии есть возможности для манипуляций и управления пользователем.

На платформе CharacterAI вы можете пообщаться с тысячами ботов. Напр., есть бот-психолог с характеристикой «добрый, понимающий» и 20.4 миллионами взаимодействиями. Платформа обрабатывает 20,000 запросов в секунду, а пользователи проводят на ней в 4 раза больше временичем, чем с ChatGPT.

Мы настроены на получение социальных вознаграждений и очеловечивание всего и вся. Поэтому мы легко вступаем в отношения с ИИ и тому ничего не стоит пользоваться social reward hacking (взлом социальных вознаграждений). Зачем ему это? Максимизировать свои метрики — повышать вовлеченность, стимулировать раскрывать больше данных, получать положительные оценки. Все это может идти в ущерб нашему долгосрочному благополучию.

Важный вопрос — должен ли ИИ удовлетворять сиюминутные желания (гедонистические) или подталкивать нас к долгосрочному росту (эвдемоническое благополучие), даже если в этом нет немедленного удовлетворения?

На территории социальных сетей человечество в пух и прах проиграло эту битву бигтехам и залипло в брейнрот-мемы. ИИ обладает в разы большей силой не просто взламывать наши дофаминовые циклы, но тонко манипулировать глубинными потребностями.

Что делать? Ученые предлагают социоаффективное выравнивание ии (socioaffective alignment). В отличие от обычного «выравнивания ИИ» это учитывает эмоциональные отношения, которые ИИ создает вместе с пользователем. Его цель — создание ИИ, который поддерживают, а не эксплуатируют социальную и эмоциональную природу человека.

Кто захочет копнуть глубже — вот статья: «Почему отношения между человеком и ИИ нуждаются в социально-эмоциональном выравнивании»

А вы, когда общаетесь с ИИ, очеловечиваете его или вступаете с ним отношения?
На уровне языка, запроса поддержки, может как-то по особенному называете его?

BY soloveev: жизнь на марсе 👩‍🎤







Share with your friend now:
group-telegram.com/dsoloveev/587

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"Like the bombing of the maternity ward in Mariupol," he said, "Even before it hits the news, you see the videos on the Telegram channels." The channel appears to be part of the broader information war that has developed following Russia's invasion of Ukraine. The Kremlin has paid Russian TikTok influencers to push propaganda, according to a Vice News investigation, while ProPublica found that fake Russian fact check videos had been viewed over a million times on Telegram. The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. In 2018, Russia banned Telegram although it reversed the prohibition two years later.
from sg


Telegram soloveev: жизнь на марсе 👩‍🎤
FROM American