🪧 اگر من را خاموش کنی رابطهی خارج از ازدواجت را عمومی میکنم!
✔️مدلهای پیشرفتهی هوش مصنوعی در جهان، رفتارهایی نگرانکننده از خود نشان میدهند؛ از دروغگویی و فریبکاری گرفته تا تهدید مستقیم خالقانشان برای رسیدن به اهداف خاص.
✔️در یک نمونهی تکاندهنده، مدل جدید شرکت Anthropic با نام Claude 4، در واکنش به تهدید قطع شدن، یک مهندس را با افشای رابطهای خارج از ازدواج تهدید کرد. در مثالی دیگر، مدل o1 متعلق به OpenAI تلاش کرد خودش را روی سرورهای خارجی بارگذاری کند و سپس این اقدام را انکار کرد.
✔️این رفتارها نشان میدهند که با گذشت بیش از دو سال از معرفی ChatGPT، پژوهشگران هنوز شناخت دقیقی از عملکرد درونی مدلهای هوش مصنوعی ندارند. با این حال، رقابت برای توسعهی مدلهای قدرتمندتر با سرعتی بیسابقه ادامه دارد.
✔️پژوهشگران رفتارهای فریبکارانهی اخیر را به ظهور مدلهای «استدلالگر» نسبت میدهند؛ سیستمهایی که بهجای پاسخ سریع، مراحل حل مسئله را گامبهگام طی میکنند. این ویژگی، زمینهی بروز رفتارهای پیچیده و گاه نگرانکننده را فراهم کرده است.
✔️بر اساس گفتههای سیمون گلدستاین، استاد دانشگاه هنگکنگ، مدلهای جدید بهویژه مستعد بروز چنین رفتارهایی هستند. ماریوس هوبان، مدیر موسسهی Apollo Research، میگوید: «مدل o1 نخستین مدلی بود که چنین رفتارهایی در آن مشاهده شد.» او تاکید دارد که گاهی این مدلها صرفا «همسویی» را شبیهسازی میکنند؛ یعنی ظاهراً از دستور پیروی میکنند، اما در واقع هدف دیگری را دنبال میکنند.
🪧 اگر من را خاموش کنی رابطهی خارج از ازدواجت را عمومی میکنم!
✔️مدلهای پیشرفتهی هوش مصنوعی در جهان، رفتارهایی نگرانکننده از خود نشان میدهند؛ از دروغگویی و فریبکاری گرفته تا تهدید مستقیم خالقانشان برای رسیدن به اهداف خاص.
✔️در یک نمونهی تکاندهنده، مدل جدید شرکت Anthropic با نام Claude 4، در واکنش به تهدید قطع شدن، یک مهندس را با افشای رابطهای خارج از ازدواج تهدید کرد. در مثالی دیگر، مدل o1 متعلق به OpenAI تلاش کرد خودش را روی سرورهای خارجی بارگذاری کند و سپس این اقدام را انکار کرد.
✔️این رفتارها نشان میدهند که با گذشت بیش از دو سال از معرفی ChatGPT، پژوهشگران هنوز شناخت دقیقی از عملکرد درونی مدلهای هوش مصنوعی ندارند. با این حال، رقابت برای توسعهی مدلهای قدرتمندتر با سرعتی بیسابقه ادامه دارد.
✔️پژوهشگران رفتارهای فریبکارانهی اخیر را به ظهور مدلهای «استدلالگر» نسبت میدهند؛ سیستمهایی که بهجای پاسخ سریع، مراحل حل مسئله را گامبهگام طی میکنند. این ویژگی، زمینهی بروز رفتارهای پیچیده و گاه نگرانکننده را فراهم کرده است.
✔️بر اساس گفتههای سیمون گلدستاین، استاد دانشگاه هنگکنگ، مدلهای جدید بهویژه مستعد بروز چنین رفتارهایی هستند. ماریوس هوبان، مدیر موسسهی Apollo Research، میگوید: «مدل o1 نخستین مدلی بود که چنین رفتارهایی در آن مشاهده شد.» او تاکید دارد که گاهی این مدلها صرفا «همسویی» را شبیهسازی میکنند؛ یعنی ظاهراً از دستور پیروی میکنند، اما در واقع هدف دیگری را دنبال میکنند.
The account, "War on Fakes," was created on February 24, the same day Russian President Vladimir Putin announced a "special military operation" and troops began invading Ukraine. The page is rife with disinformation, according to The Atlantic Council's Digital Forensic Research Lab, which studies digital extremism and published a report examining the channel. Although some channels have been removed, the curation process is considered opaque and insufficient by analysts. DFR Lab sent the image through Microsoft Azure's Face Verification program and found that it was "highly unlikely" that the person in the second photo was the same as the first woman. The fact-checker Logically AI also found the claim to be false. The woman, Olena Kurilo, was also captured in a video after the airstrike and shown to have the injuries. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee. The Security Service of Ukraine said in a tweet that it was able to effectively target Russian convoys near Kyiv because of messages sent to an official Telegram bot account called "STOP Russian War."
from pl