Telegram Group & Telegram Channel
Вчера у зарубежного LMSYS вышли значительные обновления.
Самое главное - внедрение фильтра style control.
В июле возникло много критики и непонимания почему малая модель GPT-4o mini обогнала в рейтинге все большие модели, такие как GPT-4, Claude 3.5 Sonnet и т.д.

Автор канала "эйай ньюз" выдвинул следующую гипотезу: "4o mini просто даёт более детальные ответы относительно быстро. Людям влом всё это всё читать и они голосуют за 4o mini, не особо проверяя корректность".

Вчера LMSYS подтвердил эту гипотезу, выложив статью "Does style matter? Disentangling style and substance in Chatbot Arena”. Краткое содержание на русском доступно тут.

Мы уже в процессе добавления фильтра style control на llmarena.ru, планируем выкатить на следующей неделе! Следите за апдейтами и голосуйте за лучшие модели на нашей платформе!



group-telegram.com/llm_arena/6
Create:
Last Update:

Вчера у зарубежного LMSYS вышли значительные обновления.
Самое главное - внедрение фильтра style control.
В июле возникло много критики и непонимания почему малая модель GPT-4o mini обогнала в рейтинге все большие модели, такие как GPT-4, Claude 3.5 Sonnet и т.д.

Автор канала "эйай ньюз" выдвинул следующую гипотезу: "4o mini просто даёт более детальные ответы относительно быстро. Людям влом всё это всё читать и они голосуют за 4o mini, не особо проверяя корректность".

Вчера LMSYS подтвердил эту гипотезу, выложив статью "Does style matter? Disentangling style and substance in Chatbot Arena”. Краткое содержание на русском доступно тут.

Мы уже в процессе добавления фильтра style control на llmarena.ru, планируем выкатить на следующей неделе! Следите за апдейтами и голосуйте за лучшие модели на нашей платформе!

BY LLM Arena


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/llm_arena/6

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care. That hurt tech stocks. For the past few weeks, the 10-year yield has traded between 1.72% and 2%, as traders moved into the bond for safety when Russia headlines were ugly—and out of it when headlines improved. Now, the yield is touching its pandemic-era high. If the yield breaks above that level, that could signal that it’s on a sustainable path higher. Higher long-dated bond yields make future profits less valuable—and many tech companies are valued on the basis of profits forecast for many years in the future. Anastasia Vlasova/Getty Images So, uh, whenever I hear about Telegram, it’s always in relation to something bad. What gives?
from in


Telegram LLM Arena
FROM American