Kimi K2 Thinking
Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.
Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.
Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.
Блогпост
Веса
@ai_newz
Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.
Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.
Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.
Блогпост
Веса
@ai_newz
❤100👍41🔥23❤🔥1
group-telegram.com/ai_newz/4237
Create:
Last Update:
Last Update:
Kimi K2 Thinking
Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.
Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.
Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.
Блогпост
Веса
@ai_newz
Больше всего впечатляет возможность выполнять сотни тулколов последовательно преследуя одну задачу. Моделька крайне эффективна в этом — 44,9% на текстовой части HLE с тулюзом это очень хорошие результаты. Без тулов она выдаёт 23.9%, а с параллельным скейлингом вроде GPT-5 Pro/Gemini Deep Think вообще 51%.
Распространяется модель исключительно в int4, все результаты бенчмарков от квантизированной версии модели. Moonshot говорят что потерь качества от квантизации нет, но проверить это не выйдет.
Моделька уже доступна на kimi.com (с ограниченным набором тулов, полноценный агентный режим обещают скоро), на 🤗 и в API (пока только официальном). Окно контекста остаётся прежним — 256к, цена тоже остаётся как и у оригинальной K2.
Блогпост
Веса
@ai_newz
BY эйай ньюз


Share with your friend now:
group-telegram.com/ai_newz/4237
