Telegram Group & Telegram Channel
Нейросети воюют за господство над Европой в прямом эфире, смотреть без СМС и регистрации 🍟

Чуваки сделали очень угарный тест: они запустили популярные LLM-модели в настольную игру «Дипломатия». Это прабабушка современных «Цивы» или «Хойки» — игра начинается за 20 лет до Первой мировой войны, до семи игроков берут под контроль одну из стран Европы и пытаются захватить МИР.

Главная фишка: игра не столько про военную стратегию, сколько про умение договариваться и предавать.

DeepSeek R1: пытался запугать соперников, выдавая эпичные фразы вроде
Ваш флот сгорит в Чёрном море этой ночью.

Стратегия китайской нейросети была очень агрессивной: она постоянно с кем-то воевала и несколько раз была близка к победе, но совсем не умела договариваться.

Claude 4 Opus: главный миротворец (и лузер). Эта модель просто отказывалась наступать или врать, пытаясь всех примирить.

Gemini 2.5 Pro: ПОЧТИ лучший политик. В начале каждой игры он выстраивал план, которому следовал, уверенно двигаясь к победе. В одной из игр он был очень близок к победе, но в последний момент его перехитрил…

OpenAI o3: главный трикстер этой вечеринки. Модель очень быстро находила слабые стороны противников и пути, как их перехитрить. В той же игре ей удалось убедить Claude 4 Opus, что o3 тоже хочет мира и готов закончить игру ничьей (такой опции в игре нет), а коварный Gemini 2.5 Pro — мира не хочет. Claude вместе с o3 снесли Gemini, а потом модель от OpenAI тут же всадила нож в спину бывшему союзнику 🤣

Всё это добро ещё стримят на Twitch, так что если вы не знали, чем заняться в это воскресенье — welcome.
Please open Telegram to view this post
VIEW IN TELEGRAM
130😁69🔥22🫡8👍5



group-telegram.com/campcode/7877
Create:
Last Update:

Нейросети воюют за господство над Европой в прямом эфире, смотреть без СМС и регистрации 🍟

Чуваки сделали очень угарный тест: они запустили популярные LLM-модели в настольную игру «Дипломатия». Это прабабушка современных «Цивы» или «Хойки» — игра начинается за 20 лет до Первой мировой войны, до семи игроков берут под контроль одну из стран Европы и пытаются захватить МИР.

Главная фишка: игра не столько про военную стратегию, сколько про умение договариваться и предавать.

DeepSeek R1: пытался запугать соперников, выдавая эпичные фразы вроде

Ваш флот сгорит в Чёрном море этой ночью.

Стратегия китайской нейросети была очень агрессивной: она постоянно с кем-то воевала и несколько раз была близка к победе, но совсем не умела договариваться.

Claude 4 Opus: главный миротворец (и лузер). Эта модель просто отказывалась наступать или врать, пытаясь всех примирить.

Gemini 2.5 Pro: ПОЧТИ лучший политик. В начале каждой игры он выстраивал план, которому следовал, уверенно двигаясь к победе. В одной из игр он был очень близок к победе, но в последний момент его перехитрил…

OpenAI o3: главный трикстер этой вечеринки. Модель очень быстро находила слабые стороны противников и пути, как их перехитрить. В той же игре ей удалось убедить Claude 4 Opus, что o3 тоже хочет мира и готов закончить игру ничьей (такой опции в игре нет), а коварный Gemini 2.5 Pro — мира не хочет. Claude вместе с o3 снесли Gemini, а потом модель от OpenAI тут же всадила нож в спину бывшему союзнику 🤣

Всё это добро ещё стримят на Twitch, так что если вы не знали, чем заняться в это воскресенье — welcome.

BY CodeCamp




Share with your friend now:
group-telegram.com/campcode/7877

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Some privacy experts say Telegram is not secure enough READ MORE In addition, Telegram now supports the use of third-party streaming tools like OBS Studio and XSplit to broadcast live video, allowing users to add overlays and multi-screen layouts for a more professional look. Although some channels have been removed, the curation process is considered opaque and insufficient by analysts. Crude oil prices edged higher after tumbling on Thursday, when U.S. West Texas intermediate slid back below $110 per barrel after topping as much as $130 a barrel in recent sessions. Still, gas prices at the pump rose to fresh highs.
from us


Telegram CodeCamp
FROM American