На платформе теперь доступен майский рейтинг языковых моделей. Строится он на основе ваших оценок, без синтетических тестов.
Что изменилось в рейтинге: ⏺️ Кол-во моделей выросло до 63 ⏺️ Общее число голосов — почти 70 000 ⏺️Gemma 3 27B (Google) — резкий рост Elo и попадание в топ-группу ⏺️claude-3-5-sonnet-20241022 — укрепила позиции: +Elo, +голоса ⏺️ У большинства лидеров — небольшие колебания Elo, но рост голосов ⏺️ Появились новые модели, включая claude-3-7-sonnet-20250219 ⏺️GPT-4o и Gemini Pro сохранили высокие позиции, несмотря на лёгкое снижение Elo
Топ остался стабильным, интерес к новым моделям растёт, голосов становится всё больше.
Посмотреть таблицу полностьюможно: — на сайте llmarena.ru, — или прямо в Telegram, во вкладке «Таблица лидеров».
Не забывайте отдавать голос лучшему ответу на Анонимной Арене — каждая оценка помогает повысить точность лидерборда и быстрее прогреть новые модели.
Как считаете, кого не хватает в топе? Пишите в комментариях 👇
На платформе теперь доступен майский рейтинг языковых моделей. Строится он на основе ваших оценок, без синтетических тестов.
Что изменилось в рейтинге: ⏺️ Кол-во моделей выросло до 63 ⏺️ Общее число голосов — почти 70 000 ⏺️Gemma 3 27B (Google) — резкий рост Elo и попадание в топ-группу ⏺️claude-3-5-sonnet-20241022 — укрепила позиции: +Elo, +голоса ⏺️ У большинства лидеров — небольшие колебания Elo, но рост голосов ⏺️ Появились новые модели, включая claude-3-7-sonnet-20250219 ⏺️GPT-4o и Gemini Pro сохранили высокие позиции, несмотря на лёгкое снижение Elo
Топ остался стабильным, интерес к новым моделям растёт, голосов становится всё больше.
Посмотреть таблицу полностьюможно: — на сайте llmarena.ru, — или прямо в Telegram, во вкладке «Таблица лидеров».
Не забывайте отдавать голос лучшему ответу на Анонимной Арене — каждая оценка помогает повысить точность лидерборда и быстрее прогреть новые модели.
Как считаете, кого не хватает в топе? Пишите в комментариях 👇
Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." Some people used the platform to organize ahead of the storming of the U.S. Capitol in January 2021, and last month Senator Mark Warner sent a letter to Durov urging him to curb Russian information operations on Telegram. "We as Ukrainians believe that the truth is on our side, whether it's truth that you're proclaiming about the war and everything else, why would you want to hide it?," he said. As a result, the pandemic saw many newcomers to Telegram, including prominent anti-vaccine activists who used the app's hands-off approach to share false information on shots, a study from the Institute for Strategic Dialogue shows. The Dow Jones Industrial Average fell 230 points, or 0.7%. Meanwhile, the S&P 500 and the Nasdaq Composite dropped 1.3% and 2.2%, respectively. All three indexes began the day with gains before selling off.
from us