group-telegram.com/c3po_notes/330
Last Update:
Думаю, все видели свежую статью от AI Research лабы Apple про reasoning в LLM. Если нет, то вкратце: ризонинг на самом деле — не настоящий ризонинг, а просто, грубо говоря, выученные цепочки рассуждений и расход токенов на предсказание этих паттернов. Сетки могут продолжать пытаться рассуждать, даже если в цепочке уже пришли к правильному выводу, просто чтобы сжечь бюджет на рассуждения.
По факту, ребята поставили эксперимент, получили результаты, озвучили интерпретацию. С этим можно не соглашаться, задавать вопросы к дизайну эксперимента, выводам и так далее. Но что делает интернет-общественность? Докапывается до личностей и авторитетов — ad hominem. Почти вся критика, которую я видел, сосредоточена на двух вещах:
— Личность автора: главным автором числится студентка PhD, стажёрка. Да ещё и женщина! Что она себе позволяет? Кто она такая, чтобы делать громкие заявления?
— Apple: компания, у которой нет ни одной своей большой LLM и которая проиграла AI-гонку. Что они себе позволяют? Вот когда сделают что-то серьёзное, тогда и поговорим.
Всё, что нужно знать о поехавших фанатосах.
BY Записки C3PO

Share with your friend now:
group-telegram.com/c3po_notes/330