Telegram Group Search
Google выпускает новые продукты, Claude 4 шантажирует пользователей, OpenAI покупает компанию Джони Айва

Рассказываем, что произошло в мире ИИ за последнее время.

Новинки от Google

Компания Google действует на всех фронтах и обновила целый ряд ИИ-инструментов.

• Модель Gemini 2.5 Pro получила режим Deep Think, который одновременно генерирует несколько цепочек рассуждений, что повышает качество ответов. Улучшения заметны в мультимодальных и математических тестах, а также при генерации кода. Обновлена также мини-модель Gemini 2.5 Flash.

• Анонсирован Project Mariner — агентная система для автоматизации задач на компьютере. Это прямой конкурент Operator от OpenAI и Computer Use от Anthropic.

• Вышли обновления Imagen и VeoVeo 3 теперь создает реалистичные видео со звуком. Представлено приложение Flow для режиссеров: на основе Veo, Imagen и Gemini в нем можно выстраивать клипы и сцены для рассказа истории.

• Поиск Google теперь делает ИИ-выжимки результатов. С помощью новых функций в AI Mode можно получить сводку релевантных товаров без перехода по множеству сайтов — ИИ подберет и покажет предложения, а также оформит покупку. Компания также запустила виртуальную примерочную, с помощью которой пользователь перед покупкой может оценить, как на нем будет смотреться одежда.

Анонсирован синхронный перевод речи для Google Meet. На старте поддерживается испанский язык, со временем список расширится.

• Запущена подписка Google AI Ultra, включающая доступ ко всем последним моделям и приложениям, 30 ТБ на Google Drive и YouTube Premium. Стоимость составит 250 долларов в месяц.

Обновления LLM от Anthropic


Компания Anthropic, один из главных конкурентов OpenAI, представила четвертую версию своей языковой модели. Поскольку продукты компании преимущественно применяются для автоматизации разработки в IT, ключевые улучшения коснулись способности генерировать код и автономно выполнять пользовательские задачи с помощью различных инструментов — браузера, командной строки и других.

Claude Opus 4 показал лучший результат среди агентов для разработки в тесте SWE-bench. Claude Sonnet 4 также продемонстрировал улучшенные возможности генерации кода, однако в остальных тестах его показатели остаются на уровне предыдущей версии Sonnet 3.7.

Anthropic заявила, что при запуске новинок применила повышенные меры безопасности. Также компания выпустила технический отчет, в котором описала результаты тестирования «поведения» новых моделей. В частности, выяснилось, что модель способна к шантажу, саботажу, обману и проявлению инициативы в некоторых случаях.

OpenAI купила компанию Джони Айва

Бывший дизайнер Apple Джони Айв — в его портфолио входят Mac, iPhone, iPad, Apple Watch, дизайн операционных систем — и гендиректор OpenAI Сэм Альтман объявили о слиянии своих компаний для разработки принципиально новых продуктов с искусственным интеллектом.

Сотрудничество между Айвом и командой OpenAI началось два года назад как неформальная работа креативного коллектива LoveFrom с создателями ChatGPT. Первоначальные идеи и эксперименты постепенно переросли в конкретные дизайнерские решения.

Год назад Айв совместно с бывшими топ-менеджерами Apple основал новую компанию io. OpenAI приобрела io (сумма сделки оценивается в 6,5 млрд долларов), чтобы более тесно взаимодействовать с исследовательскими и инженерными командами в Сан-Франциско. Айв и LoveFrom возьмут на себя ключевые дизайнерские и творческие функции в объединенной компании.

По словам основателей, цель проекта — создать новое семейство устройств, которые помогут людям учиться, исследовать мир и творить, используя возможности современного ИИ. Релиз первого продукта планируется в следующем году.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
CLIP: нейросеть, которая понимает текст и картинки

Мультимодальные модели могут обрабатывать несколько видов данных одновременно. Например, они «понимают» не только текст, но и изображения и аудио. Сегодня рассказываем о нейросети CLIP, которая представляет изображения и тексты как единый тип данных, и рассмотрим, как это может быть полезно. Это — первый из серии наших материалов о мультимодальных нейросетях.

Кратко: как работают эти нейросети?

CLIP (Contrastive Language–Image Pre-training) была разработана в 2021 году компанией OpenAI, создавшей GPT. Contrastive в названии обозначает метод обучения нейросетей Contrastive learning, при котором нейросеть учится сравнивать/противопоставлять объекты на основе их семантического соответствия.

CLIP представляет изображения и текст как единую модальность (один тип данных). Другими словами, эта нейросеть строит универсальные численные представления для текстов и изображений, которые затем можно использовать для сравнения семантической схожести картинки и описания. Поэтому она отлично подходит для поисковиков, онлайн-магазинов и рынках стоковых изображений.

А еще CLIP можно использовать в паре с языковыми и генеративными моделями, тем самым наделяя их мультимодальными способностями. Такие модели могут генерировать изображения по текстовым описаниям, создавать описания изображений, анализировать визуальное содержание и выполнять другие задачи.

Подробно о работе мультимодальных нейросетей – с примерами, терминами и картинками с собаками, мы рассказали в полной версии материала. Из нее же узнаете о третьем применении CLIP и о том, способна ли она распознать на картинке банан, если он будет пиксельным, черно-белым или разрезанным на кусочки.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Набор на Летнюю школу в мастерскую дата-журналистики закрывается через 3…2…1…

Вы ещё успеваете подать заявки в мастерскую «Системного Блока» @datajourschool на «Летней школе» на Волге до 1 июня включительно.

С 19 июля по 3 августа вы сможете бесплатно* научиться искать, собирать и обрабатывать данные, а затем — превращать их в красивые и понятные визуализации.

Узнать подробнее о наборе в мастерскую можно здесь, познакомиться с примерами наших визуализаций — в посте ниже.

Регистрация: https://nabor.letnyayashkola.org/

*Есть добровольный взнос на питание и проживание

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
От алкоголизма до книжного рынка: подборка инфографик «Системного Блока»

Наш дата-отдел регулярно исследует открытые данные и рассказывает о процессах в обществе и культуре России и мира с помощью инфографики. В этом посте собрали материалы прошлых лет о кино, песнях и метро России.

🚇 Метро в России

По количеству открытых станций метро в России тоже лидирует Москва: за 12 лет в стране построили меньше станций метро, чем в одной Москве в 2021 году. Например, в Санкт-Петербурге станцию Театральную не могут открыть с 2008 года. О текущей ситуации и перспективах метро в других городах можно узнать здесь.

🍾 Кому на Руси пить хорошо

Ещё одна важная и неочевидная статистика о России — потребление алкоголя в стране. Рост потребления алкоголя с 2018 по 2022 год мы отобразили на карточке, а о производстве рассказали здесь.

🎬 Кино по заказу Минкульта

С 2014 года Министерство культуры публикует приоритетные для кинопроизводства темы. Среди них — популяризация героизма и неоколониальная политика стран англосаксонского мира. Правда, большинство приоритетных фильмов не окупается в прокате. Узнать больше об этой статистике можно тут.

🎤 О чем поет Родина

В 2016 году появился официальный «каталог патриотической музыки». Оказалось, что каждое третье произведение из 8 тысяч позиций каталога посвящено войне. Прежде всего — Великой отечественной. О других войнах и темах в песнях каталога, можно узнать из инфографики и этого поста.

📸 Камеры в Москве

Москва входит в топ-30 городов по покрытию камерами: в городе как минимум 193 000 камер. Самая большая плотность покрытия — в Центральном округе, там на квадратный километр приходится 198 камер. Больше информации — в нашем посте.

📚 Книжный рынок

Политика России в 2022 году сильно сказалась на книжном рынке. Среди последствий: отсутствие полиграфического оборудования, интерес к «запрещенным» произведениям и изменения в топе самых издаваемых авторов. Подробнее — в тексте поста.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Бунтующий young, ностальгирующий adult: дата-исследование книжного рынка

Сегодня отмечается Международный день защиты детей. Поскольку подготовить ребенка к грядущим сложностям и переменам иногда способна хорошая книга, предлагаем вспомнить наше исследование, посвященное рынку young adult литературы.

Тираж книг для подростков и молодежи за последние 10 лет увеличился в два раза, а в young adult стали «переупаковывать» самые разные произведения. Узнать подробнее об этом сегменте книжного рынка и изменениях в нём за последние годы можно из этого поста, а пока предлагаем вам угадать, какого тега нет в топе раздела young adult в «Читай-городе».

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Герои и драконы с привязкой к местности: как цифровая картография помогает исследовать мифы

Драконы, духи и герои древних легенд теперь бродят не только по туманным мирам — они появляются на привычных нам картах. Современные базы данных и GIS-технологии позволяют визуализировать фольклорные и мифологические сюжеты. Рассказываем о трех цифровых картах, которые помогут вам проследить путь Одиссея, найти все проклятые места в Ирландии и узнать, как Стоунхендж связан с Мерлином. 

🧜🏼‍♂️ Myths on map: пути античных героев 

Цифровая карта посвящена мифам Древней Греции. Здесь есть информация о героях, событиях, городах и античных текстах, в которых отражены легендарные сюжеты. Например, география перемещений Ахиллеса насчитывает 36 мест, а Геракла – 91. Ну а если вы до сих пор не дочитали список кораблей из «Илиады», то можете взглянуть хотя бы на список мест, откуда они прибыли, — это целых 218 названий.

🧌 Emerald Isle: в поисках лепреконов и сокровищ 

Проект посвящен ирландским мифам, сказкам и историям о привидениях. На карте отмечены точки, связанные с разными сюжетами: с местами обитания чудовищ, с зарытыми сокровищами, с событиями из отдельных циклов легенд. Так, недалеко от Дублина обитает ирландский всадник без головы. Здесь же находится одно из проклятых мест, которых в Ирландии, судя по карте, немало.

🧙🏻‍♂️ A Map of Myth,  Legend and Folklore: английские замки и привидения

Эта интерактивная карта разработана благотворительной организацией English Heritage, которая занимается сохранением объектов культурного наследия. Проект визуализирует более 1500 легенд и мифов распространенных в Англии. Истории разделены на категории: духи и призраки, мифические существа (например, драконы и великаны) и исторические легенды. К каждой точке добавлены иллюстрации, аудиозаписи рассказов и ссылки на исторические источники. Работает поиск по типам существ, временным периодам и регионам.

Подробнее об этих проектах и о цифровой революции в классификации мифов, узнаете из полной версии статьи.

Время чтения: 6,5 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
От поля битвы к байтам: как устроена Всемирная база данных исторических сражений

Какие страны воевали больше всего? Сколько было войн и где происходили ключевые битвы? Ответить на эти вопросы можно благодаря Всемирной базе данных исторических сражений, созданной в 2021 году. Она систематизирует данные о примерно 8000 сражений с древних времен по сегодняшний день. Рассказываем о ней подробнее в этом посте и новом материале.

Кратко: что за база?

World Historical Battles Database (WHBD) использует данные из Wikidata, Википедии и ряда других источников (например, Military Wiki). Здесь можно найти информацию о сторонах конфликта, географических координатах, времени и результатах битв.


Больше всего военных столкновений —согласно этой базе — было на территории США, следом с большим отрывом идут Франция и Италия. Создатель проекта предполагает несколько возможных объяснений таким показателям. Во-первых, на этих территориях действительно могло произойти больше сражений, чем в других регионах. Во-вторых, войны в этих регионах могли быть зафиксированы с большей вероятностью, и/или меньше записей могло быть утеряно. В-третьих, делом может быть в содержании исходных онлайн-источников.

О том, на какое время приходится пик военных конфликтов, как велась работа над созданием базы и чем WHBD отличается от похожих проектов, узнаете из полной версии статьи.

Время чтения: 9 минут


🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
<Цифровое> солнце русской поэзии

Сегодня день рождения Александра Сергеевича Пушкина. Если вы уже перечитали любимые стихи его авторства, а теперь хотите разом освоить все наследие писателя, то рекомендуем вам наш обзор семантического издания Пушкин <цифровой>.

Кратко: что это за проект?

Пушкин ⟨цифровой⟩ — уже третье семантическое издание текстов и персоналий «большой литературы» в русскоязычном веб-пространстве (есть ещё «Слово Толстого» от команды Tolstoy Digital и Chekhov Digital, о котором «Системный Блокъ» писал здесь и здесь). Над созданием проекта о Пушкине параллельно работают Институт русской литературы (Пушкинский Дом) и Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, а DH-центр ИТМО разрабатывает интерфейсы для навигации, чтения и изучения материалов.

На сайте проекта можно найти основные тексты произведений Пушкина, его рукописи и материалы академического пушкиноведения с середины XIX века и до наших дней. В отдельном разделе представлены тексты-путеводители, которые помогут современному читателю лучше понять контекст произведений. Там, например, можно выяснить, что в стихотворении «Я помню чудное мгновенье…» Пушкин позаимствовал у Жуковского, Баратынского и Батюшкова, а также какой была в жизни вдохновившая это стихотворение Анна Керн. 

Путеводители раскрывают культурный контекст, биографию людей пушкинского круга и поэтику текстов. Они параллельны и связаны одновременно. Каждый можно прочесть отдельно как лонгрид (на странице даже указано время чтения), а можно изучать все три слоя одновременно, листая само произведение и переходя по ссылкам.

Узнать, какие возможности открывает работа с порталом, как она устроена и какие дальнейшие планы есть у создателей проекта, можно из полной версии статьи.

Время чтения: 10,5 минут

🌞 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Grok в Telegram, обновление DeepSeek R1 и суперкомпьютер OpenAI в ОАЭ

Рассказываем, что произошло в мире ИИ за последнее время

Обновленный DeepSeek R1

Нашумевшая китайская языковая модель DeepSeek R1 получила обновление.

В тестах по математике и программированию улучшенная версия стала сравнима с лучшими коммерческими моделями — OpenAI o3 и Google Gemini 2.5 Pro. Модель стала реже галлюцинировать (выдавать фактологически неверные ответы), а также научилась использовать внешние инструменты (function calling): искать информацию в интернете, делать запросы к базам данных, выполнять код в среде разработки и т. д.

Модель, как и прежде, остается в открытом доступе и может использоваться в коммерческих целях.

OpenAI строит суперкомпьютер в ОАЭ


В рамках инициативы OpenAI For Countries компания анонсировала партнерство с ОАЭ. Согласно соглашению, OpenAI построит в стране вычислительный кластер, который заработает к 2026 году, а ОАЭ, в свою очередь, проинвестирует в американский проект Stargate — сеть суперкомпьютеров для обучения моделей ИИ.

Построенный кластер позволит интегрировать модели OpenAI на национальном уровне в государственные структуры, учебные заведения и систему здравоохранения с соблюдением требований к безопасности данных.

Проект Stargate был анонсирован вскоре после инаугурации Дональда Трампа и предполагает инвестиции в размере 500 млрд долларов на строительство серии дата-центров в США для развития и исследования искусственного интеллекта в течение четырех лет.

Инициатива OpenAI For Countries была представлена в мае в рамках проекта Stargate. Она предлагает помощь заинтересованным правительствам в создании «суверенной ИИ-инфраструктуры» в координации с правительством США.

Grok интегрируют в Telegram

Павел Дуров анонсировал глубокую интеграцию языковой модели Grok от лаборатории Илона Маска xAI в мессенджер Telegram.

ИИ-функции, которые появятся этим летом:

• удобный доступ к Grok — чат с моделью можно будет закрепить вверху списка всех чатов, а вопросы задавать через строку поиска,
• организация переписки — Grok будет категоризировать историю чатов по тематикам и создавать выжимки новых сообщений,
• помощь в создании контента — генерация развернутых сообщений на основе коротких черновиков, создание стикеров и аватарок,
• анализ информации — суммаризация данных из файлов и по ссылкам, проверка информации в каналах,
• модерация и автоответы — Grok сможет модерировать групповые чаты и отвечать на сообщения в бизнес-аккаунтах (например, сообщать рабочие часы или отвечать на частые вопросы).

Также Telegram получит 300 млн долларов инвестиций от xAI и 50% дохода с подписок на Grok, проданных через мессенджер.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Коллокации, эпиграфика и древняя ДНК: подборка новых тестов «Системного Блока»

Если в эту пятницу вам хочется и развлечься, и узнать что-то новое, наши новые тесты – отличное решение. Разберетесь, что такое огамическое письмо, что роднит «крокодиловых слез» и «зеленый свет» и какое открытие последних лет стало прорывом в палеогенетике.

Что такое коллокации и как они помогают гуманитариям?

Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как и зачем изучают этот феномен, а теперь предлагаем вам проверить свои знания. Готовы? Тогда проходите тест по ссылке!

Что вы знаете о цифровой эпиграфике?

Эпиграфика — это наука о надписях на камнях, керамике, металлах и других твердых материалах. С появлением цифровых технологий, таких как 3D-моделирование и фотограмметрия, процесс документирования памятников стал точнее и полнее. Мы рассказывали об эпиграфических корпусах и о расшифровке надписей — теперь предлагаем вам пройти тест.

Что и зачем изучает палеогенетика?

В последние десятилетия палеогенетика и биоинформатика стали мощным двигателем развития археологии. Ученые, работающие в этих направлениях, воссоздают историю наших предков через анализ их ДНК, чтобы узнать больше о миграциях и эволюции человека. Пройдите наш тест, чтобы вспомнить (или узнать!), как наука помогает расшифровывать загадки прошлого.

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Хармс, Брюсов и «Гамлет»: цифровые методы в поиске интертекстуальных связей

Сегодня для поиска сходств между текстами можно не читать тысячи книг, а правильно обучить языковую модель, чтобы она сделала за вас хотя бы часть работы. В новой статье рассказываем о нескольких проектах, которые помогают изучать интертекстуальные связи, а еще о том, может ли их обнаружить обычная нейросеть.

Tesserae

C 2008 года на базе университета в Баффало осуществляется проект Tesserae, изначально созданный для поиска интертекстуальных связей между классическими древнегреческими, латинскими текстами (подробнее о нем мы рассказывали здесь). У проекта есть действующий онлайн-интерфейс и репозиторий.

InterIDEAS

«Философский» датасет InterIDEAS включает 45 тысяч страниц философских текстов, написанных с 1750 по 1950 год. В нём с помощью LLM и экспертов размечены обращения к книгам, идеологиям, религиям, историческим событиям, а также словам и поступкам других людей. Увы, свободного доступа к датасету пока нет.

WordWeb-IDEM

После проекта HyperHamlet, где были собраны всевозможные цитатные переклички с «Гамлетом» — от Сенеки до постов в социальных сетях, команда из Базельского университета взялась и за другие пьесы эпохи Возрождения. Сейчас в WordWeb-IDEM уже собрано более 1000 пьес и доступно несколько видов поиска по представленным текстам.

LLM

Сегодня LLM уже могут выполнять некоторые задачи по поиску параллелей в художественных текстах. Они позволяют перейти от поиска по ключевым словам к поиску «по смыслам», т. е. по содержательным пересечениям. Благодаря этому можно найти неочевидные пересечения в литературе. Например, вот такую пару цитат из текстов Брюсова и Хармса: «Старик, увидав девочку, остановился. Катя решилась спросить его. — Скажите, пожалуйста, как пройти в Вифлеем?» («Дитя и безумец», Брюсов); «Молодой человек почистил перчатками свои брюки и деликатным голосом спросил: — Скажите, дедушка, как тут пройти на небо?» («Молодой человек, удививший сторожа», Хармс). 

Правда, пока работа по поиску отсылок и перекличек в литературе с помощью LLM — скорее перспективное направление, чем готовый реализованный проект. Подробнее о таком использовании языковых моделей, а также о других проектах, которые облегчают исследователям работу с интертекстом, узнаете из полной версии статьи.

Время чтения: 16 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Цифровое чтение: как экраны меняют восприятие текстов

Сегодня цифровые устройства стали привычной частью учебы, а электронные ресурсы — от учебников до онлайн-платформ — все чаще используются в образовании. Пока авторы научно-популярных книг рисуют мрачные картины того, как мы потеряем способность к глубокому чтению, разбираемся, как переход к другим вариантам взаимодействия с информацией, влияет и повлияет на наше восприятие текстов разной длины.

Короткие тексты

Молодое поколение часто читает цифровые тексты до 500 слов быстрее, чем бумажные. Это происходит за счет быстрого скроллинга. Более того, результаты исследований показывают, что само восприятие текстов такой длины не меняется, будь они на экране или на бумаге.

Длинные тексты

С более объемными текстами всё немного иначе. Например, школьники 7–9 классов используют нелинейные стратегии: пролистывают текст, оценивая релевантность по заголовкам, ищут ключевые слова через Ctrl+F и делают цифровые заметки. Это ускоряет поиск нужной информации, но ведет к фрагментарному восприятию. Так что мы едва ли можем говорить о глубоком чтении. На то же указывают и данные айтрекинга (метода отслеживания движений глаз).

А вот как влияют на чтение цифровых текстов не их длина, а их язык и культурные особенности в странах, в которых проводятся такие исследования, мы пока понимаем хуже. Ученым еще предстоит заполнить эту лакуну, а преподавателям — объяснить особенности взаимодействия с цифровыми текстами и предложить решения для проблем, которые наверняка возникнут у читателей нового поколения.

Подробнее об этих решениях и об исследованиях, которые концентрировались на русских школьниках и текстах, узнаете из полной версии статьи.

Время чтения: 12 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Скрепить и сохранить: как из папок и бухгалтерских книг вырос цифровой порядок

Как файл связан с подшиванием к делу? Какие методы хранения бумаг можно найти и у фламандских художников, и в модных кофейнях? Наконец, кто придумал хранить документы в папках? Отвечаем на эти вопросы, разбираясь с историей хранения.

Кратко: как развивалась история бухгалтерии?


Бумага появилась в Европе еще в XI веке, но ее массовое производство началось только через триста лет. К этому моменту деловая жизнь Европы уже была достаточно развита, торговые и финансовые операции нужно было тщательно документировать, и проще было пользоваться дешевой бумагой, чем дорогим пергаментом. Так для записей стали использовать пустые книги. Память об этом сохранилась в разных языках: от разных «книг» образованы и слово бухгалтерия, и английское bookkeeping.

Затем для упорядочивания документов использовались несколько способов. Например, накалывание листа на острие (что до сих пор делают с чеками во многих заедениях). В XVI веке этим методом уже точно пользовались, что подтверждает, например, картина Яна Сандерса ван Хемессена 1536 года. Другим популярным методом было сшивание ниткой, когда документы буквально подшивают к делу. А благодаря этому методу до нас постепенно добралось слово файл, восходяще к латинской нити filum.

Ну а папка-регистратор с арочным механизмом, которую до сих пор используют в офисах, приобрела свою окончательную форму к XX веку. Этим мы обязаны американцу Джеймсу Шеннону, который придумал первый регистратор, и двум немцам — Фридриху Зённеккену и Луису Лейцу. Независимо друг от друга они превратили планшет Шеннона в более знакомую нам папку.

Подробнее о разных страницах истории хранения – физической и цифровой – узнаете из полной версии статьи.

Время чтения: 10 минут

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
Midjourney научилась генерировать видео, Meta* инвестирует в Scale AI, Mistral сделала рассуждающую LLM

Рассказываем, что нового в мире ИИ произошло за последнее время.

Генерация видео в Midjourney

Midjourney, один из первых успешных сервисов по генерации изображений, объявил о запуске функции создания видео.

В отличие от моделей OpenAI Sora и Google Veo 3, которые фокусируются на создании видео по текстовым описаниям, решение от Midjourney специализируется на анимации уже существующих изображений. 

Пользователь может сгенерировать изображение на сайте компании, а затем анимировать его одним из двух способов: воспользоваться функцией автоматического анимирования или текстом описать желаемое движение объектов и камеры. Те же действия можно выполнить и с загруженными пользователем изображениями.

Для анимации доступны два режима: high motion и low motion. Первый режим подходит для сцен, где камера практически неподвижна, а объекты малоподвижны. Второй режим оптимален для создания динамичных видео. После генерации пользователь может продлить видео на четыре секунды, причем эту операцию можно применить к одному ролику максимум четыре раза.

Стоимость генерации 5-секундного видео на данный момент в восемь раз превышает цену за создание одного изображения. Впрочем, компания планирует корректировать расценки в будущем в зависимости от спроса.

По заявлению Midjourney, новая модель является важным шагом к реализации глобальной цели — разработке искусственного интеллекта, способного в реальном времени формировать интерактивный 3D-мир, где пользователи смогут свободно перемещаться и взаимодействовать с объектами и персонажами.

Meta инвестирует в Scale AI

Корпорация Meta проинвестировала 14 млрд долларов в Scale AI — стартап, специализирующийся на разметке данных для обучения моделей искусственного интеллекта.

В результате этой сделки Meta приобрела 49% акций Scale AI, тем самым оценив стартап в 29 млрд долларов. Кроме того, основатель Scale AI, 28-летний Александр Ван, присоединится к команде Meta по разработке ИИ.

Услугами Scale AI пользуется множество крупных компаний, включая основных конкурентов Meta в ИИ-гонке — OpenAI и Google. По сообщениям СМИ, после объявления об инвестициях конкуренты Meta начали постепенно сворачивать сотрудничество со Scale AI.

Mistral выпустила первую рассуждающую модель

Французская компания Mistral представила Magistral — свою первую рассуждающую (reasoning) языковую модель (LLM). Рассуждающие модели генерируют развернутую цепочку логических рассуждений перед формированием финального ответа, что значительно повышает его качество и обоснованность. Примеры таких моделей — GPT o1 и o3 от OpenAI, Claude Sonnet в режиме extended thinking, Gemini 2.0 Flash Thinking и Gemini 2.5 от Google и R1 от DeepSeek.

По сравнению с предыдущим флагманом французской компании, Mistral Medium, новая модель сильно улучшила результаты в основных тестах. Однако в сравнении с конкурирующей DeepSeek-R1 она показывает сопоставимые или несколько более низкие результаты.

Magistral выпущена в двух версиях — Medium и Small. Более мощная версия Medium доступна только через API, тогда как Small, уступающая по качеству, распространяется в открытом доступе.

Mistral долгое время оставалась одной из немногих крупных ИИ-компаний, не выпускавших рассуждающие модели. После выхода Magistral среди лидеров отрасли только Meta не предлагает подобного функционала — ее модель Llama 4 по-прежнему не поддерживает режим рассуждений.

*Российские власти считают Meta террористической организацией

🤖 «Системный Блокъ» @sysblok
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/25 15:13:36
Back to Top
HTML Embed Code: