Telegram Group & Telegram Channel
ИИ-поиск от Google, третья Qwen и модель-подхалим GPT-4o

Рассказываем, что произошло в мире ИИ за последнее время.

AI Mode от Google

Корпорация Google открыла доступ к поиску на основе больших языковых моделей для пользователей из Америки.

В отличие от традиционного поиска, при котором пользователь получает список ссылок на релевантные веб-сайты в ответ на запрос, ИИ-поиск суммаризирует поисковую выдачу и выдает текстовую выжимку. Благодаря внедрению языковых моделей в процесс поиска пользователь может задавать длинные и сложные запросы, а также уточняющие вопросы к ответу. Вместо замены текущего режима поиска Google добавила ИИ-поиск в отдельную вкладку под названием AI Mode — на уровне с вкладками «Изображения», «Новости», «Видео» и т. д.

AI Mode тестируется с начала марта этого года в закрытом режиме. Ранее Google уже пыталась интегрировать LLM в поиск, однако в ответ получила негативные реакции пользователей из-за большого количества галлюцинаций в поисковой выдаче. AI Mode является прямым конкурентом продуктов многих ИИ-компаний: PerplexityGPT Search и DeepResearch от OpenAI,  Research от Anthropic.

Qwen3 — новое поколение открытых языковых моделей

Холдинг Alibaba Group (владеет AliExpress, TaoBao и другими маркетплейсами) обновил свое семейство языковых моделей Qwen. Qwen3 доступен в следующих размерах (в млрд параметров): 0,6, 1,7, 4, 8, 14, 32.

Помимо них, также были представлены две модели с архитектурой Mixture of Experts: во время генерации ответа модель использует лишь часть всех параметров (их называют активными), при этом, какие именно параметры задействованы во время ответа — зависит от конкретного запроса пользователя. Mixture of Experts версии доступны в двух размерах: 30 млрд с 3 млрд активными и флагманская модель с 235 млрд параметров из которых 22 млрд активные.

Флагманская модель в основных тестах опережает DeepSeek-R1 и сопоставима с последними лучшими моделями (Google Gemini 2.5 Pro и OpenAI o3-mini). Более компактные версии опережают конкурентов сопоставимых размеров.

Все модели поддерживают режим рассуждений, когда перед финальным ответом модель генерирует цепочку логических рассуждений. Модели были обучены на текстах на 119 языках. Полный список языков доступен на сайте модели. Qwen3 можно использовать для коммерческих целей.

Модели семейства Qwen — в числе лидеров открытых LLM: их используют энтузиасты, коммерческие компании и научные исследователи.

OpenAI откатила обновление GPT-4o после жалоб о чрезмерной лести

Компания OpenAI вернула старую версию GPT-4o после того, как многочисленные пользователи пожаловались на избыточное количество лести и подхалимства в ответах обновленной версии.

Во время подготовки обновления GPT, сделанного в конце апреля 2025, компания, помимо новых обучающих данных и улучшенных методов, использовала оценки ответов от пользователей (их можно дать через кнопки «лайк» и «дизлайк» в интерфейсе чата). По словам компании, по отдельности новые данные и методы показывали улучшения, благодаря чему обновленная модель показала прирост в качестве в заранее подготовленных тестах. Но в совокупности улучшения привели к измененному поведению. 

Используемые тесты, а также группа тестировщиков фокусировались только на определенных показателях, в числе которых не было метрики, отвечающей за угодничащее поведение модели. И хотя некоторые тестировщики отметили, что модель стала «вести себя» немного иначе, обновление все равно решили сделать доступным.

Для предотвращения подобных ситуаций OpenAI приняли несколько новых мер: начали работу над улучшением существующих тестов и A/B-тестирования, приоритизировали качественные оценки поведения модели от тестировщиков.

Более детальный отчет о случившемся и выводах, сделанных компанией, доступен в официальном блоге.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/sysblok/1168
Create:
Last Update:

ИИ-поиск от Google, третья Qwen и модель-подхалим GPT-4o

Рассказываем, что произошло в мире ИИ за последнее время.

AI Mode от Google

Корпорация Google открыла доступ к поиску на основе больших языковых моделей для пользователей из Америки.

В отличие от традиционного поиска, при котором пользователь получает список ссылок на релевантные веб-сайты в ответ на запрос, ИИ-поиск суммаризирует поисковую выдачу и выдает текстовую выжимку. Благодаря внедрению языковых моделей в процесс поиска пользователь может задавать длинные и сложные запросы, а также уточняющие вопросы к ответу. Вместо замены текущего режима поиска Google добавила ИИ-поиск в отдельную вкладку под названием AI Mode — на уровне с вкладками «Изображения», «Новости», «Видео» и т. д.

AI Mode тестируется с начала марта этого года в закрытом режиме. Ранее Google уже пыталась интегрировать LLM в поиск, однако в ответ получила негативные реакции пользователей из-за большого количества галлюцинаций в поисковой выдаче. AI Mode является прямым конкурентом продуктов многих ИИ-компаний: PerplexityGPT Search и DeepResearch от OpenAI,  Research от Anthropic.

Qwen3 — новое поколение открытых языковых моделей

Холдинг Alibaba Group (владеет AliExpress, TaoBao и другими маркетплейсами) обновил свое семейство языковых моделей Qwen. Qwen3 доступен в следующих размерах (в млрд параметров): 0,6, 1,7, 4, 8, 14, 32.

Помимо них, также были представлены две модели с архитектурой Mixture of Experts: во время генерации ответа модель использует лишь часть всех параметров (их называют активными), при этом, какие именно параметры задействованы во время ответа — зависит от конкретного запроса пользователя. Mixture of Experts версии доступны в двух размерах: 30 млрд с 3 млрд активными и флагманская модель с 235 млрд параметров из которых 22 млрд активные.

Флагманская модель в основных тестах опережает DeepSeek-R1 и сопоставима с последними лучшими моделями (Google Gemini 2.5 Pro и OpenAI o3-mini). Более компактные версии опережают конкурентов сопоставимых размеров.

Все модели поддерживают режим рассуждений, когда перед финальным ответом модель генерирует цепочку логических рассуждений. Модели были обучены на текстах на 119 языках. Полный список языков доступен на сайте модели. Qwen3 можно использовать для коммерческих целей.

Модели семейства Qwen — в числе лидеров открытых LLM: их используют энтузиасты, коммерческие компании и научные исследователи.

OpenAI откатила обновление GPT-4o после жалоб о чрезмерной лести

Компания OpenAI вернула старую версию GPT-4o после того, как многочисленные пользователи пожаловались на избыточное количество лести и подхалимства в ответах обновленной версии.

Во время подготовки обновления GPT, сделанного в конце апреля 2025, компания, помимо новых обучающих данных и улучшенных методов, использовала оценки ответов от пользователей (их можно дать через кнопки «лайк» и «дизлайк» в интерфейсе чата). По словам компании, по отдельности новые данные и методы показывали улучшения, благодаря чему обновленная модель показала прирост в качестве в заранее подготовленных тестах. Но в совокупности улучшения привели к измененному поведению. 

Используемые тесты, а также группа тестировщиков фокусировались только на определенных показателях, в числе которых не было метрики, отвечающей за угодничащее поведение модели. И хотя некоторые тестировщики отметили, что модель стала «вести себя» немного иначе, обновление все равно решили сделать доступным.

Для предотвращения подобных ситуаций OpenAI приняли несколько новых мер: начали работу над улучшением существующих тестов и A/B-тестирования, приоритизировали качественные оценки поведения модели от тестировщиков.

Более детальный отчет о случившемся и выводах, сделанных компанией, доступен в официальном блоге.

🤖 «Системный Блокъ» @sysblok

BY Системный Блокъ


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/sysblok/1168

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Given the pro-privacy stance of the platform, it’s taken as a given that it’ll be used for a number of reasons, not all of them good. And Telegram has been attached to a fair few scandals related to terrorism, sexual exploitation and crime. Back in 2015, Vox described Telegram as “ISIS’ app of choice,” saying that the platform’s real use is the ability to use channels to distribute material to large groups at once. Telegram has acted to remove public channels affiliated with terrorism, but Pavel Durov reiterated that he had no business snooping on private conversations. False news often spreads via public groups, or chats, with potentially fatal effects. For example, WhatsApp restricted the number of times a user could forward something, and developed automated systems that detect and flag objectionable content. Ukrainian President Volodymyr Zelensky said in a video message on Tuesday that Ukrainian forces "destroy the invaders wherever we can."
from in


Telegram Системный Блокъ
FROM American