Telegram Group & Telegram Channel
От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI



group-telegram.com/SciTechQuantumAI/1214
Create:
Last Update:

От провала к половине успеха за пять лет: удивительный прогресс языковых моделей

Исследователи из организации METR в Беркли обнаружили тревожную тенденцию: скорость развития искусственного интеллекта в решении сложных задач растет экспоненциально. С 2019 года так называемый «временной горизонт» — показатель, отражающий продолжительность задач, которые ИИ может выполнить с 50% вероятностью успеха — удваивался каждые семь месяцев, а в 2024 году темп ускорился до удвоения каждые три месяца.

В ходе исследования были проанализированы 13 передовых моделей ИИ на почти 170 реальных задачах в области программирования, кибербезопасности и логического мышления. Результаты поразительны: если в 2019 году GPT-2 не мог решить задачи длительностью более минуты, то выпущенный в феврале 2024 года Claude 3.7 Sonnet уже справляется с половиной задач, требующих от человека 59 минут работы. При сохранении текущих темпов к 2029 году ИИ сможет решать задачи, занимающие у человека целый месяц — время, достаточное для запуска стартапа или научного открытия.

Прогресс моделей ИИ объясняется не только увеличением объемов обучающих данных и количества параметров, но и качественными улучшениями в логическом мышлении, умении использовать инструменты и исправлять ошибки. Однако экономический эффект от этого развития пока ограничен, поскольку текущий «временной горизонт» около 40 минут недостаточен для выполнения по-настоящему ценных задач. Эксперты разделились во мнениях: одни считают прогнозы слишком оптимистичными, другие уверены, что потенциал ИИ используется недостаточно активно из-за отсутствия инвестиций в его интеграцию.

@SciTechQuantumAI

BY Изобретая будущее




Share with your friend now:
group-telegram.com/SciTechQuantumAI/1214

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

There was another possible development: Reuters also reported that Ukraine said that Belarus could soon join the invasion of Ukraine. However, the AFP, citing a Pentagon official, said the U.S. hasn’t yet seen evidence that Belarusian troops are in Ukraine. Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” "Your messages about the movement of the enemy through the official chatbot … bring new trophies every day," the government agency tweeted. In a message on his Telegram channel recently recounting the episode, Durov wrote: "I lost my company and my home, but would do it again – without hesitation." In the United States, Telegram's lower public profile has helped it mostly avoid high level scrutiny from Congress, but it has not gone unnoticed.
from us


Telegram Изобретая будущее
FROM American