group-telegram.com/campcode/7877
Create:
Last Update:
Last Update:
Нейросети воюют за господство над Европой в прямом эфире, смотреть без СМС и регистрации
Чуваки сделали очень угарный тест: они запустили популярные LLM-модели в настольную игру «Дипломатия». Это прабабушка современных «Цивы» или «Хойки» — игра начинается за 20 лет до Первой мировой войны, до семи игроков берут под контроль одну из стран Европы и пытаются захватить МИР.
Главная фишка: игра не столько про военную стратегию, сколько про умение договариваться и предавать.
— DeepSeek R1: пытался запугать соперников, выдавая эпичные фразы вроде
Ваш флот сгорит в Чёрном море этой ночью.
Стратегия китайской нейросети была очень агрессивной: она постоянно с кем-то воевала и несколько раз была близка к победе, но совсем не умела договариваться.
— Claude 4 Opus: главный миротворец (и лузер). Эта модель просто отказывалась наступать или врать, пытаясь всех примирить.
— Gemini 2.5 Pro: ПОЧТИ лучший политик. В начале каждой игры он выстраивал план, которому следовал, уверенно двигаясь к победе. В одной из игр он был очень близок к победе, но в последний момент его перехитрил…
— OpenAI o3: главный трикстер этой вечеринки. Модель очень быстро находила слабые стороны противников и пути, как их перехитрить. В той же игре ей удалось убедить Claude 4 Opus, что o3 тоже хочет мира и готов закончить игру ничьей (такой опции в игре нет), а коварный Gemini 2.5 Pro — мира не хочет. Claude вместе с o3 снесли Gemini, а потом модель от OpenAI тут же всадила нож в спину бывшему союзнику
Всё это добро ещё стримят на Twitch, так что если вы не знали, чем заняться в это воскресенье — welcome.