Telegram Group & Telegram Channel
Dealer.AI
Color_coded_racetrack_large_channel.gif
This media is not supported in your browser
VIEW IN TELEGRAM
Sakana.AI опять. ALE Bench и ALE-agents.

Бенчмарк по решению сложных задач оптимизации: маршрутизации, планирования, в т.ч. NP-трудные.

Дядя уже говорил о том, что такие задачи нужны именно для развития reasoning свойств и проверки их эффективности, а так же coding, тк ахах никто не решает LLM это влоб, а генерит код алгоритмов или под спец. пакеты. Напомню, что помимо открытых задач, тут широкий простор для синтетики.  И вот мы видим бенч.

Вдобавок, зарелизили агента, способного "решать" подобные задачи (в кавычках тк NP трудные задачи не все разрешимы за полиномиальное время).

Как обычно смотрят для NP-задач лучшее решение? Мы можем иметь уже забрутфоршенные задачи, где известно лучшее решение или решения. Для оценки награды используется, к примеру, метод идеальной точки - когда смотрим расстояние или отклонение до ее значения. Если интересно, см. методы дискретной оптимизации и методы многокритериальной оптимизации.

Про работу Sakana.AI смотрим ниже. 👇👇👇
Код. Блог. Датасет.
👍11😁1



group-telegram.com/dealerAI/1301
Create:
Last Update:

Sakana.AI опять. ALE Bench и ALE-agents.

Бенчмарк по решению сложных задач оптимизации: маршрутизации, планирования, в т.ч. NP-трудные.

Дядя уже говорил о том, что такие задачи нужны именно для развития reasoning свойств и проверки их эффективности, а так же coding, тк ахах никто не решает LLM это влоб, а генерит код алгоритмов или под спец. пакеты. Напомню, что помимо открытых задач, тут широкий простор для синтетики.  И вот мы видим бенч.

Вдобавок, зарелизили агента, способного "решать" подобные задачи (в кавычках тк NP трудные задачи не все разрешимы за полиномиальное время).

Как обычно смотрят для NP-задач лучшее решение? Мы можем иметь уже забрутфоршенные задачи, где известно лучшее решение или решения. Для оценки награды используется, к примеру, метод идеальной точки - когда смотрим расстояние или отклонение до ее значения. Если интересно, см. методы дискретной оптимизации и методы многокритериальной оптимизации.

Про работу Sakana.AI смотрим ниже. 👇👇👇
Код. Блог. Датасет.

BY Dealer.AI


Share with your friend now:
group-telegram.com/dealerAI/1301

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The last couple days have exemplified that uncertainty. On Thursday, news emerged that talks in Turkey between the Russia and Ukraine yielded no positive result. But on Friday, Reuters reported that Russian President Vladimir Putin said there had been some “positive shifts” in talks between the two sides. This provided opportunity to their linked entities to offload their shares at higher prices and make significant profits at the cost of unsuspecting retail investors. And indeed, volatility has been a hallmark of the market environment so far in 2022, with the S&P 500 still down more than 10% for the year-to-date after first sliding into a correction last month. The CBOE Volatility Index, or VIX, has held at a lofty level of more than 30. Oleksandra Matviichuk, a Kyiv-based lawyer and head of the Center for Civil Liberties, called Durov’s position "very weak," and urged concrete improvements. "Markets were cheering this economic recovery and return to strong economic growth, but the cheers will turn to tears if the inflation outbreak pushes businesses and consumers to the brink of recession," he added.
from kr


Telegram Dealer.AI
FROM American