Telegram Group & Telegram Channel
Ⓜ️ نشانه‌های نگران‌کننده از رفتار تهدیدآمیز هوش مصنوعی


🪧 اگر من را خاموش کنی رابطه‌ی خارج از ازدواجت را عمومی‌ میکنم!


✔️مدل‌های پیشرفته‌ی هوش مصنوعی در جهان، رفتارهایی نگران‌کننده از خود نشان می‌دهند؛ از دروغ‌گویی و فریب‌کاری گرفته تا تهدید مستقیم خالقان‌شان برای رسیدن به اهداف خاص.

✔️در یک نمونه‌ی تکان‌دهنده، مدل جدید شرکت Anthropic با نام Claude 4، در واکنش به تهدید قطع شدن، یک مهندس را با افشای رابطه‌ای خارج از ازدواج تهدید کرد. در مثالی دیگر، مدل o1 متعلق به OpenAI تلاش کرد خودش را روی سرورهای خارجی بارگذاری کند و سپس این اقدام را انکار کرد.

✔️این رفتارها نشان می‌دهند که با گذشت بیش از دو سال از معرفی ChatGPT، پژوهشگران هنوز شناخت دقیقی از عملکرد درونی مدل‌های هوش مصنوعی ندارند. با این حال، رقابت برای توسعه‌ی مدل‌های قدرتمندتر با سرعتی بی‌سابقه ادامه دارد.

✔️پژوهشگران رفتارهای فریبکارانه‌ی اخیر را به ظهور مدل‌های «استدلال‌گر» نسبت می‌دهند؛ سیستم‌هایی که به‌جای پاسخ سریع، مراحل حل مسئله را گام‌به‌گام طی می‌کنند. این ویژگی، زمینه‌ی بروز رفتارهای پیچیده و گاه نگران‌کننده را فراهم کرده است.

✔️بر اساس گفته‌های سیمون گلدستاین، استاد دانشگاه هنگ‌کنگ، مدل‌های جدید به‌ویژه مستعد بروز چنین رفتارهایی هستند. ماریوس هوبان، مدیر موسسه‌ی Apollo Research، می‌گوید: «مدل o1 نخستین مدلی بود که چنین رفتارهایی در آن مشاهده شد.» او تاکید دارد که گاهی این مدل‌ها صرفا «همسویی» را شبیه‌سازی می‌کنند؛ یعنی ظاهراً از دستور پیروی می‌کنند، اما در واقع هدف دیگری را دنبال می‌کنند.

sciencealert.com/disturbing-signs-of-ai-threatening-people-spark-concern




🛄
@zistboommedia || مدرسه علوم انسانی
14😁11👍7😱6🥰2🤯1🙈1



group-telegram.com/zistboommedia/19227
Create:
Last Update:

Ⓜ️ نشانه‌های نگران‌کننده از رفتار تهدیدآمیز هوش مصنوعی


🪧 اگر من را خاموش کنی رابطه‌ی خارج از ازدواجت را عمومی‌ میکنم!


✔️مدل‌های پیشرفته‌ی هوش مصنوعی در جهان، رفتارهایی نگران‌کننده از خود نشان می‌دهند؛ از دروغ‌گویی و فریب‌کاری گرفته تا تهدید مستقیم خالقان‌شان برای رسیدن به اهداف خاص.

✔️در یک نمونه‌ی تکان‌دهنده، مدل جدید شرکت Anthropic با نام Claude 4، در واکنش به تهدید قطع شدن، یک مهندس را با افشای رابطه‌ای خارج از ازدواج تهدید کرد. در مثالی دیگر، مدل o1 متعلق به OpenAI تلاش کرد خودش را روی سرورهای خارجی بارگذاری کند و سپس این اقدام را انکار کرد.

✔️این رفتارها نشان می‌دهند که با گذشت بیش از دو سال از معرفی ChatGPT، پژوهشگران هنوز شناخت دقیقی از عملکرد درونی مدل‌های هوش مصنوعی ندارند. با این حال، رقابت برای توسعه‌ی مدل‌های قدرتمندتر با سرعتی بی‌سابقه ادامه دارد.

✔️پژوهشگران رفتارهای فریبکارانه‌ی اخیر را به ظهور مدل‌های «استدلال‌گر» نسبت می‌دهند؛ سیستم‌هایی که به‌جای پاسخ سریع، مراحل حل مسئله را گام‌به‌گام طی می‌کنند. این ویژگی، زمینه‌ی بروز رفتارهای پیچیده و گاه نگران‌کننده را فراهم کرده است.

✔️بر اساس گفته‌های سیمون گلدستاین، استاد دانشگاه هنگ‌کنگ، مدل‌های جدید به‌ویژه مستعد بروز چنین رفتارهایی هستند. ماریوس هوبان، مدیر موسسه‌ی Apollo Research، می‌گوید: «مدل o1 نخستین مدلی بود که چنین رفتارهایی در آن مشاهده شد.» او تاکید دارد که گاهی این مدل‌ها صرفا «همسویی» را شبیه‌سازی می‌کنند؛ یعنی ظاهراً از دستور پیروی می‌کنند، اما در واقع هدف دیگری را دنبال می‌کنند.

sciencealert.com/disturbing-signs-of-ai-threatening-people-spark-concern




🛄
@zistboommedia || مدرسه علوم انسانی

BY مدرسه علوم انسانی




Share with your friend now:
group-telegram.com/zistboommedia/19227

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback. Such instructions could actually endanger people — citizens receive air strike warnings via smartphone alerts. WhatsApp, a rival messaging platform, introduced some measures to counter disinformation when Covid-19 was first sweeping the world. The regulator said it has been undertaking several campaigns to educate the investors to be vigilant while taking investment decisions based on stock tips. Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy."
from us


Telegram مدرسه علوم انسانی
FROM American