DeepSeek официально обновили свою бесплатную reasoning-модель R1
На LiveCodeBranch R1 почти на одном уровне с o3! В тесте AIME 2025 точность увеличилась с 70% в предыдущей версии до 87,5%.
В целом модель стала быстрее обрабатывать запросы, при этом она меньше галлюцинирует и лучше пишет код. Работать над задачей может до 30–60 минут без потери контекста.
Тестим здесь. Hugging Face здесь.
@xor_journal
На LiveCodeBranch R1 почти на одном уровне с o3! В тесте AIME 2025 точность увеличилась с 70% в предыдущей версии до 87,5%.
В целом модель стала быстрее обрабатывать запросы, при этом она меньше галлюцинирует и лучше пишет код. Работать над задачей может до 30–60 минут без потери контекста.
Тестим здесь. Hugging Face здесь.
@xor_journal
group-telegram.com/xor_journal/6770
Create:
Last Update:
Last Update:
DeepSeek официально обновили свою бесплатную reasoning-модель R1
На LiveCodeBranch R1 почти на одном уровне с o3! В тесте AIME 2025 точность увеличилась с 70% в предыдущей версии до 87,5%.
В целом модель стала быстрее обрабатывать запросы, при этом она меньше галлюцинирует и лучше пишет код. Работать над задачей может до 30–60 минут без потери контекста.
Тестим здесь. Hugging Face здесь.
@xor_journal
На LiveCodeBranch R1 почти на одном уровне с o3! В тесте AIME 2025 точность увеличилась с 70% в предыдущей версии до 87,5%.
В целом модель стала быстрее обрабатывать запросы, при этом она меньше галлюцинирует и лучше пишет код. Работать над задачей может до 30–60 минут без потери контекста.
Тестим здесь. Hugging Face здесь.
@xor_journal
BY XOR


Share with your friend now:
group-telegram.com/xor_journal/6770