sysblok Telegram Group

Системный Блокъ

CLIP: нейросеть, которая понимает текст и картинки

Мультимодальные модели могут обрабатывать несколько видов данных одновременно. Например, они «понимают» не только текст, но и изображения и аудио. Сегодня рассказываем о нейросети CLIP, которая представляет изображения и тексты как единый тип данных, и рассмотрим, как это может быть полезно. Это — первый из серии наших материалов о мультимодальных нейросетях.

Кратко: как работают эти нейросети?

CLIP (Contrastive Language–Image Pre-training) была разработана в 2021 году компанией OpenAI, создавшей GPT. Contrastive в названии обозначает метод обучения нейросетей Contrastive learning, при котором нейросеть учится сравнивать/противопоставлять объекты на основе их семантического соответствия.

CLIP представляет изображения и текст как единую модальность (один тип данных). Другими словами, эта нейросеть строит универсальные численные представления для текстов и изображений, которые затем можно использовать для сравнения семантической схожести картинки и описания. Поэтому она отлично подходит для поисковиков, онлайн-магазинов и рынках стоковых изображений.

А еще CLIP можно использовать в паре с языковыми и генеративными моделями, тем самым наделяя их мультимодальными способностями. Такие модели могут генерировать изображения по текстовым описаниям, создавать описания изображений, анализировать визуальное содержание и выполнять другие задачи.

Подробно о работе мультимодальных нейросетей – с примерами, терминами и картинками с собаками, мы рассказали в полной версии материала. Из нее же узнаете о третьем применении CLIP и о том, способна ли она распознать на картинке банан, если он будет пиксельным, черно-белым или разрезанным на кусочки.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Нейросеть CLIP: принцип работы мультимодальных векторных представлений

Что такое мультимодальные модели? Рассказываем, как нейросеть CLIP использует косинусную близость векторных представлений для сопоставления текстов и изображений и для чего это может быть полезно.

4.4K viewsedited 08:41

Системный Блокъ

Набор на Летнюю школу в мастерскую дата-журналистики закрывается через 3…2…1…

Вы ещё успеваете подать заявки в мастерскую «Системного Блока» @datajourschool на «Летней школе» на Волге до 1 июня включительно.

С 19 июля по 3 августа вы сможете бесплатно* научиться искать, собирать и обрабатывать данные, а затем — превращать их в красивые и понятные визуализации.

Узнать подробнее о наборе в мастерскую можно здесь, познакомиться с примерами наших визуализаций — в посте ниже.

Регистрация: https://nabor.letnyayashkola.org/

*Есть добровольный взнос на питание и проживание

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

«Системный Блокъ» продолжает набор в мастерскую дата-журналистики на «Летней Школе»! UPD: Мы принимаем заявки от всех желающих до 1 июня❗️

Вы тоже любите данные, исследования, еду на костре и сосны? В июле «Летняя школа» на Волге открывает новый сезон. Во…

10.1K viewsedited 14:59

Системный Блокъ

От алкоголизма до книжного рынка: подборка инфографик «Системного Блока»

Наш дата-отдел регулярно исследует открытые данные и рассказывает о процессах в обществе и культуре России и мира с помощью инфографики. В этом посте собрали материалы прошлых лет о кино, песнях и метро России.

🚇 Метро в России

По количеству открытых станций метро в России тоже лидирует Москва: за 12 лет в стране построили меньше станций метро, чем в одной Москве в 2021 году. Например, в Санкт-Петербурге станцию Театральную не могут открыть с 2008 года. О текущей ситуации и перспективах метро в других городах можно узнать здесь.

🍾 Кому на Руси пить хорошо

Ещё одна важная и неочевидная статистика о России — потребление алкоголя в стране. Рост потребления алкоголя с 2018 по 2022 год мы отобразили на карточке, а о производстве рассказали здесь.

🎬 Кино по заказу Минкульта

С 2014 года Министерство культуры публикует приоритетные для кинопроизводства темы. Среди них — популяризация героизма и неоколониальная политика стран англосаксонского мира. Правда, большинство приоритетных фильмов не окупается в прокате. Узнать больше об этой статистике можно тут.

🎤 О чем поет Родина

В 2016 году появился официальный «каталог патриотической музыки». Оказалось, что каждое третье произведение из 8 тысяч позиций каталога посвящено войне. Прежде всего — Великой отечественной. О других войнах и темах в песнях каталога, можно узнать из инфографики и этого поста.

📸 Камеры в Москве

Москва входит в топ-30 городов по покрытию камерами: в городе как минимум 193 000 камер. Самая большая плотность покрытия — в Центральном округе, там на квадратный километр приходится 198 камер. Больше информации — в нашем посте.

📚 Книжный рынок

Политика России в 2022 году сильно сказалась на книжном рынке. Среди последствий: отсутствие полиграфического оборудования, интерес к «запрещенным» произведениям и изменения в топе самых издаваемых авторов. Подробнее — в тексте поста.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

3.7K views14:59

Системный Блокъ

Бунтующий young, ностальгирующий adult: дата-исследование книжного рынка

Сегодня отмечается Международный день защиты детей. Поскольку подготовить ребенка к грядущим сложностям и переменам иногда способна хорошая книга, предлагаем вспомнить наше исследование, посвященное рынку young adult литературы.

Тираж книг для подростков и молодежи за последние 10 лет увеличился в два раза, а в young adult стали «переупаковывать» самые разные произведения. Узнать подробнее об этом сегменте книжного рынка и изменениях в нём за последние годы можно из этого поста, а пока предлагаем вам угадать, какого тега нет в топе раздела young adult в «Читай-городе».

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

2.8K views14:51

Системный Блокъ

Какого тега НЕТ в лидерах раздела young adult в «Читай-городе»?

Anonymous Quiz

Американские писатели

22%

Фэнтези о дворцовых интригах

582 voters2.8K views14:51

Системный Блокъ

Герои и драконы с привязкой к местности: как цифровая картография помогает исследовать мифы

Драконы, духи и герои древних легенд теперь бродят не только по туманным мирам — они появляются на привычных нам картах. Современные базы данных и GIS-технологии позволяют визуализировать фольклорные и мифологические сюжеты. Рассказываем о трех цифровых картах, которые помогут вам проследить путь Одиссея, найти все проклятые места в Ирландии и узнать, как Стоунхендж связан с Мерлином.

🧜🏼‍♂️ Myths on map: пути античных героев

Цифровая карта посвящена мифам Древней Греции. Здесь есть информация о героях, событиях, городах и античных текстах, в которых отражены легендарные сюжеты. Например, география перемещений Ахиллеса насчитывает 36 мест, а Геракла – 91. Ну а если вы до сих пор не дочитали список кораблей из «Илиады», то можете взглянуть хотя бы на список мест, откуда они прибыли, — это целых 218 названий.

🧌 Emerald Isle: в поисках лепреконов и сокровищ

Проект посвящен ирландским мифам, сказкам и историям о привидениях. На карте отмечены точки, связанные с разными сюжетами: с местами обитания чудовищ, с зарытыми сокровищами, с событиями из отдельных циклов легенд. Так, недалеко от Дублина обитает ирландский всадник без головы. Здесь же находится одно из проклятых мест, которых в Ирландии, судя по карте, немало.

🧙🏻‍♂️ A Map of Myth, Legend and Folklore: английские замки и привидения

Эта интерактивная карта разработана благотворительной организацией English Heritage, которая занимается сохранением объектов культурного наследия. Проект визуализирует более 1500 легенд и мифов распространенных в Англии. Истории разделены на категории: духи и призраки, мифические существа (например, драконы и великаны) и исторические легенды. К каждой точке добавлены иллюстрации, аудиозаписи рассказов и ссылки на исторические источники. Работает поиск по типам существ, временным периодам и регионам.

Подробнее об этих проектах и о цифровой революции в классификации мифов, узнаете из полной версии статьи.

Время чтения: 6,5 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Мифы с привязкой к местности: как цифровая картография помогает фольклористам

«Системный Блок» рассказывает о том, как фольклористы с помощью цифровых карт визуализируют мифологические сюжеты. В нашем обзоре — проекты, посвященные греческой, ирландской и английской мифологии.

3.4K views15:51

Системный Блокъ

От поля битвы к байтам: как устроена Всемирная база данных исторических сражений

Какие страны воевали больше всего? Сколько было войн и где происходили ключевые битвы? Ответить на эти вопросы можно благодаря Всемирной базе данных исторических сражений, созданной в 2021 году. Она систематизирует данные о примерно 8000 сражений с древних времен по сегодняшний день. Рассказываем о ней подробнее в этом посте и новом материале.

Кратко: что за база?

World Historical Battles Database (WHBD) использует данные из Wikidata, Википедии и ряда других источников (например, Military Wiki). Здесь можно найти информацию о сторонах конфликта, географических координатах, времени и результатах битв.

Больше всего военных столкновений —согласно этой базе — было на территории США, следом с большим отрывом идут Франция и Италия. Создатель проекта предполагает несколько возможных объяснений таким показателям. Во-первых, на этих территориях действительно могло произойти больше сражений, чем в других регионах. Во-вторых, войны в этих регионах могли быть зафиксированы с большей вероятностью, и/или меньше записей могло быть утеряно. В-третьих, делом может быть в содержании исходных онлайн-источников.

О том, на какое время приходится пик военных конфликтов, как велась работа над созданием базы и чем WHBD отличается от похожих проектов, узнаете из полной версии статьи.

Время чтения: 9 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Какие страны воевали чаще всего: о чем может рассказать Всемирная база данных исторических сражений

Хотите узнать, какие страны воевали чаще всего в истории? Сколько всего было войн? Всемирная база данных исторических сражений собрала статистику войн за 4000 лет — от битвы при Мегиддо до войны в Ираке.

2.9K views17:26

Системный Блокъ

<Цифровое> солнце русской поэзии

Сегодня день рождения Александра Сергеевича Пушкина. Если вы уже перечитали любимые стихи его авторства, а теперь хотите разом освоить все наследие писателя, то рекомендуем вам наш обзор семантического издания Пушкин <цифровой>.

Кратко: что это за проект?

Пушкин ⟨цифровой⟩ — уже третье семантическое издание текстов и персоналий «большой литературы» в русскоязычном веб-пространстве (есть ещё «Слово Толстого» от команды Tolstoy Digital и Chekhov Digital, о котором «Системный Блокъ» писал здесь и здесь). Над созданием проекта о Пушкине параллельно работают Институт русской литературы (Пушкинский Дом) и Санкт-Петербургский Федеральный исследовательский центр Российской академии наук, а DH-центр ИТМО разрабатывает интерфейсы для навигации, чтения и изучения материалов.

На сайте проекта можно найти основные тексты произведений Пушкина, его рукописи и материалы академического пушкиноведения с середины XIX века и до наших дней. В отдельном разделе представлены тексты-путеводители, которые помогут современному читателю лучше понять контекст произведений. Там, например, можно выяснить, что в стихотворении «Я помню чудное мгновенье…» Пушкин позаимствовал у Жуковского, Баратынского и Батюшкова, а также какой была в жизни вдохновившая это стихотворение Анна Керн.

Путеводители раскрывают культурный контекст, биографию людей пушкинского круга и поэтику текстов. Они параллельны и связаны одновременно. Каждый можно прочесть отдельно как лонгрид (на странице даже указано время чтения), а можно изучать все три слоя одновременно, листая само произведение и переходя по ссылкам.

Узнать, какие возможности открывает работа с порталом, как она устроена и какие дальнейшие планы есть у создателей проекта, можно из полной версии статьи.

Время чтения: 10,5 минут

🌞 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Пушкин : два века работы в одном интерактивном издании

Возможно ли собрать двухсотлетнее наследие Пушкина и пушкинистики в единую систему? Ответ — в статье. Рассказываем о проекте, который сэкономит фанатам поэта 58 лет чтения.

5.2K views17:46

Системный Блокъ

Grok в Telegram, обновление DeepSeek R1 и суперкомпьютер OpenAI в ОАЭ

Рассказываем, что произошло в мире ИИ за последнее время

Обновленный DeepSeek R1

Нашумевшая китайская языковая модель DeepSeek R1 получила обновление.

В тестах по математике и программированию улучшенная версия стала сравнима с лучшими коммерческими моделями — OpenAI o3 и Google Gemini 2.5 Pro. Модель стала реже галлюцинировать (выдавать фактологически неверные ответы), а также научилась использовать внешние инструменты (function calling): искать информацию в интернете, делать запросы к базам данных, выполнять код в среде разработки и т. д.

Модель, как и прежде, остается в открытом доступе и может использоваться в коммерческих целях.

OpenAI строит суперкомпьютер в ОАЭ

В рамках инициативы OpenAI For Countries компания анонсировала партнерство с ОАЭ. Согласно соглашению, OpenAI построит в стране вычислительный кластер, который заработает к 2026 году, а ОАЭ, в свою очередь, проинвестирует в американский проект Stargate — сеть суперкомпьютеров для обучения моделей ИИ.

Построенный кластер позволит интегрировать модели OpenAI на национальном уровне в государственные структуры, учебные заведения и систему здравоохранения с соблюдением требований к безопасности данных.

Проект Stargate был анонсирован вскоре после инаугурации Дональда Трампа и предполагает инвестиции в размере 500 млрд долларов на строительство серии дата-центров в США для развития и исследования искусственного интеллекта в течение четырех лет.

Инициатива OpenAI For Countries была представлена в мае в рамках проекта Stargate. Она предлагает помощь заинтересованным правительствам в создании «суверенной ИИ-инфраструктуры» в координации с правительством США.

Grok интегрируют в Telegram

Павел Дуров анонсировал глубокую интеграцию языковой модели Grok от лаборатории Илона Маска xAI в мессенджер Telegram.

ИИ-функции, которые появятся этим летом:

• удобный доступ к Grok — чат с моделью можно будет закрепить вверху списка всех чатов, а вопросы задавать через строку поиска,
• организация переписки — Grok будет категоризировать историю чатов по тематикам и создавать выжимки новых сообщений,
• помощь в создании контента — генерация развернутых сообщений на основе коротких черновиков, создание стикеров и аватарок,
• анализ информации — суммаризация данных из файлов и по ссылкам, проверка информации в каналах,
• модерация и автоответы — Grok сможет модерировать групповые чаты и отвечать на сообщения в бизнес-аккаунтах (например, сообщать рабочие часы или отвечать на частые вопросы).

Также Telegram получит 300 млн долларов инвестиций от xAI и 50% дохода с подписок на Grok, проданных через мессенджер.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

3.3K views16:05

Системный Блокъ

Коллокации, эпиграфика и древняя ДНК: подборка новых тестов «Системного Блока»

Если в эту пятницу вам хочется и развлечься, и узнать что-то новое, наши новые тесты – отличное решение. Разберетесь, что такое огамическое письмо, что роднит «крокодиловых слез» и «зеленый свет» и какое открытие последних лет стало прорывом в палеогенетике.

Что такое коллокации и как они помогают гуманитариям?

Каждый, кто говорит по-русски, знает, что роль играют, условия выдвигают, а глаза бывают карими, но не коричневыми. Такие устойчивые словосочетания называются коллокациями, и существовать без них не может ни один язык. Мы уже рассказывали о том, как и зачем изучают этот феномен, а теперь предлагаем вам проверить свои знания. Готовы? Тогда проходите тест по ссылке!

Что вы знаете о цифровой эпиграфике?

Эпиграфика — это наука о надписях на камнях, керамике, металлах и других твердых материалах. С появлением цифровых технологий, таких как 3D-моделирование и фотограмметрия, процесс документирования памятников стал точнее и полнее. Мы рассказывали об эпиграфических корпусах и о расшифровке надписей — теперь предлагаем вам пройти тест.

Что и зачем изучает палеогенетика?

В последние десятилетия палеогенетика и биоинформатика стали мощным двигателем развития археологии. Ученые, работающие в этих направлениях, воссоздают историю наших предков через анализ их ДНК, чтобы узнать больше о миграциях и эволюции человека. Пройдите наш тест, чтобы вспомнить (или узнать!), как наука помогает расшифровывать загадки прошлого.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

2.6K views14:46

Системный Блокъ

Хармс, Брюсов и «Гамлет»: цифровые методы в поиске интертекстуальных связей

Сегодня для поиска сходств между текстами можно не читать тысячи книг, а правильно обучить языковую модель, чтобы она сделала за вас хотя бы часть работы. В новой статье рассказываем о нескольких проектах, которые помогают изучать интертекстуальные связи, а еще о том, может ли их обнаружить обычная нейросеть.

Tesserae

C 2008 года на базе университета в Баффало осуществляется проект Tesserae, изначально созданный для поиска интертекстуальных связей между классическими древнегреческими, латинскими текстами (подробнее о нем мы рассказывали здесь). У проекта есть действующий онлайн-интерфейс и репозиторий.

InterIDEAS

«Философский» датасет InterIDEAS включает 45 тысяч страниц философских текстов, написанных с 1750 по 1950 год. В нём с помощью LLM и экспертов размечены обращения к книгам, идеологиям, религиям, историческим событиям, а также словам и поступкам других людей. Увы, свободного доступа к датасету пока нет.

WordWeb-IDEM

После проекта HyperHamlet, где были собраны всевозможные цитатные переклички с «Гамлетом» — от Сенеки до постов в социальных сетях, команда из Базельского университета взялась и за другие пьесы эпохи Возрождения. Сейчас в WordWeb-IDEM уже собрано более 1000 пьес и доступно несколько видов поиска по представленным текстам.

LLM

Сегодня LLM уже могут выполнять некоторые задачи по поиску параллелей в художественных текстах. Они позволяют перейти от поиска по ключевым словам к поиску «по смыслам», т. е. по содержательным пересечениям. Благодаря этому можно найти неочевидные пересечения в литературе. Например, вот такую пару цитат из текстов Брюсова и Хармса: «Старик, увидав девочку, остановился. Катя решилась спросить его. — Скажите, пожалуйста, как пройти в Вифлеем?» («Дитя и безумец», Брюсов); «Молодой человек почистил перчатками свои брюки и деликатным голосом спросил: — Скажите, дедушка, как тут пройти на небо?» («Молодой человек, удививший сторожа», Хармс).

Правда, пока работа по поиску отсылок и перекличек в литературе с помощью LLM — скорее перспективное направление, чем готовый реализованный проект. Подробнее о таком использовании языковых моделей, а также о других проектах, которые облегчают исследователям работу с интертекстом, узнаете из полной версии статьи.

Время чтения: 16 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

LLM для поиска интертекстуальности

Интертекст, цитаты, аллюзии и другие связи — всё это могут выявить большие языковые модели (LLM). Евгений Обухов, математик, литературовед, специалист по Computer Science, рассказывает об огромном потенциале LLM в поиске интертекстуальности в художественных…

3.1K views09:29

Системный Блокъ

Цифровое чтение: как экраны меняют восприятие текстов

Сегодня цифровые устройства стали привычной частью учебы, а электронные ресурсы — от учебников до онлайн-платформ — все чаще используются в образовании. Пока авторы научно-популярных книг рисуют мрачные картины того, как мы потеряем способность к глубокому чтению, разбираемся, как переход к другим вариантам взаимодействия с информацией, влияет и повлияет на наше восприятие текстов разной длины.

Короткие тексты

Молодое поколение часто читает цифровые тексты до 500 слов быстрее, чем бумажные. Это происходит за счет быстрого скроллинга. Более того, результаты исследований показывают, что само восприятие текстов такой длины не меняется, будь они на экране или на бумаге.

Длинные тексты

С более объемными текстами всё немного иначе. Например, школьники 7–9 классов используют нелинейные стратегии: пролистывают текст, оценивая релевантность по заголовкам, ищут ключевые слова через Ctrl+F и делают цифровые заметки. Это ускоряет поиск нужной информации, но ведет к фрагментарному восприятию. Так что мы едва ли можем говорить о глубоком чтении. На то же указывают и данные айтрекинга (метода отслеживания движений глаз).

А вот как влияют на чтение цифровых текстов не их длина, а их язык и культурные особенности в странах, в которых проводятся такие исследования, мы пока понимаем хуже. Ученым еще предстоит заполнить эту лакуну, а преподавателям — объяснить особенности взаимодействия с цифровыми текстами и предложить решения для проблем, которые наверняка возникнут у читателей нового поколения.

Подробнее об этих решениях и об исследованиях, которые концентрировались на русских школьниках и текстах, узнаете из полной версии статьи.

Время чтения: 12 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Цифровое чтение и электронные учебники: как экраны влияют на образование

Как цифровое чтение влияет на обучение и можно ли читать с экранов так же глубоко, как и с бумаги? Расскажем, что говорят исследования об электронных текстах, как экраны меняют восприятие текстов и какие стратегии помогут учителям в цифровом образовании.

3.9K views17:11

Системный Блокъ

Скрепить и сохранить: как из папок и бухгалтерских книг вырос цифровой порядок

Как файл связан с подшиванием к делу? Какие методы хранения бумаг можно найти и у фламандских художников, и в модных кофейнях? Наконец, кто придумал хранить документы в папках? Отвечаем на эти вопросы, разбираясь с историей хранения.

Кратко: как развивалась история бухгалтерии?

Бумага появилась в Европе еще в XI веке, но ее массовое производство началось только через триста лет. К этому моменту деловая жизнь Европы уже была достаточно развита, торговые и финансовые операции нужно было тщательно документировать, и проще было пользоваться дешевой бумагой, чем дорогим пергаментом. Так для записей стали использовать пустые книги. Память об этом сохранилась в разных языках: от разных «книг» образованы и слово бухгалтерия, и английское bookkeeping.

Затем для упорядочивания документов использовались несколько способов. Например, накалывание листа на острие (что до сих пор делают с чеками во многих заедениях). В XVI веке этим методом уже точно пользовались, что подтверждает, например, картина Яна Сандерса ван Хемессена 1536 года. Другим популярным методом было сшивание ниткой, когда документы буквально подшивают к делу. А благодаря этому методу до нас постепенно добралось слово файл, восходяще к латинской нити filum.

Ну а папка-регистратор с арочным механизмом, которую до сих пор используют в офисах, приобрела свою окончательную форму к XX веку. Этим мы обязаны американцу Джеймсу Шеннону, который придумал первый регистратор, и двум немцам — Фридриху Зённеккену и Луису Лейцу. Независимо друг от друга они превратили планшет Шеннона в более знакомую нам папку.

Подробнее о разных страницах истории хранения – физической и цифровой – узнаете из полной версии статьи.

Время чтения: 10 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Как из папок и бухгалтерских книг вырос цифровой порядок

Как люди учились хранить информацию? Какова история развития папок, картотек, систем хранения? Как связаны развитие капитализма и торговли с системами хранения документов? Постоянный автор «Системного Блока», исследователь истории науки и техники, сотрудник…

2.1K views07:45

Системный Блокъ

Midjourney научилась генерировать видео, Meta* инвестирует в Scale AI, Mistral сделала рассуждающую LLM

Рассказываем, что нового в мире ИИ произошло за последнее время.

Генерация видео в Midjourney

Midjourney, один из первых успешных сервисов по генерации изображений, объявил о запуске функции создания видео.

В отличие от моделей OpenAI Sora и Google Veo 3, которые фокусируются на создании видео по текстовым описаниям, решение от Midjourney специализируется на анимации уже существующих изображений.

Пользователь может сгенерировать изображение на сайте компании, а затем анимировать его одним из двух способов: воспользоваться функцией автоматического анимирования или текстом описать желаемое движение объектов и камеры. Те же действия можно выполнить и с загруженными пользователем изображениями.

Для анимации доступны два режима: high motion и low motion. Первый режим подходит для сцен, где камера практически неподвижна, а объекты малоподвижны. Второй режим оптимален для создания динамичных видео. После генерации пользователь может продлить видео на четыре секунды, причем эту операцию можно применить к одному ролику максимум четыре раза.

Стоимость генерации 5-секундного видео на данный момент в восемь раз превышает цену за создание одного изображения. Впрочем, компания планирует корректировать расценки в будущем в зависимости от спроса.

По заявлению Midjourney, новая модель является важным шагом к реализации глобальной цели — разработке искусственного интеллекта, способного в реальном времени формировать интерактивный 3D-мир, где пользователи смогут свободно перемещаться и взаимодействовать с объектами и персонажами.

Meta инвестирует в Scale AI

Корпорация Meta проинвестировала 14 млрд долларов в Scale AI — стартап, специализирующийся на разметке данных для обучения моделей искусственного интеллекта.

В результате этой сделки Meta приобрела 49% акций Scale AI, тем самым оценив стартап в 29 млрд долларов. Кроме того, основатель Scale AI, 28-летний Александр Ван, присоединится к команде Meta по разработке ИИ.

Услугами Scale AI пользуется множество крупных компаний, включая основных конкурентов Meta в ИИ-гонке — OpenAI и Google. По сообщениям СМИ, после объявления об инвестициях конкуренты Meta начали постепенно сворачивать сотрудничество со Scale AI.

Mistral выпустила первую рассуждающую модель

Французская компания Mistral представила Magistral — свою первую рассуждающую (reasoning) языковую модель (LLM). Рассуждающие модели генерируют развернутую цепочку логических рассуждений перед формированием финального ответа, что значительно повышает его качество и обоснованность. Примеры таких моделей — GPT o1 и o3 от OpenAI, Claude Sonnet в режиме extended thinking, Gemini 2.0 Flash Thinking и Gemini 2.5 от Google и R1 от DeepSeek.

По сравнению с предыдущим флагманом французской компании, Mistral Medium, новая модель сильно улучшила результаты в основных тестах. Однако в сравнении с конкурирующей DeepSeek-R1 она показывает сопоставимые или несколько более низкие результаты.

Magistral выпущена в двух версиях — Medium и Small. Более мощная версия Medium доступна только через API, тогда как Small, уступающая по качеству, распространяется в открытом доступе.

Mistral долгое время оставалась одной из немногих крупных ИИ-компаний, не выпускавших рассуждающие модели. После выхода Magistral среди лидеров отрасли только Meta не предлагает подобного функционала — ее модель Llama 4 по-прежнему не поддерживает режим рассуждений.

*Российские власти считают Meta террористической организацией

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

1.8K views17:00

Системный Блокъ

ИИ видит черепок, археолог – историю: почему нейросети и ученые ссорятся о сходстве

Чем руководствуется человек, сопоставляя два объекта? А как их видит компьютер и может ли сравнить настолько же эффективно? А если речь идет не об обычных предметах, а о находках археологов? С тем, как устроены представления человека и компьютера о сходстве предметов, в новом тексте разбирается наш блогер Олег Лашманов.

Как мы обнаруживаем сходства

Эволюция устроила нас так, что мы воспринимаем вещь не только визуально. Мы связываем её с целым набором ощущений: тяжестью, фактурой, мягкостью, запахом, звуками окружающей среды. Всё это — часть образа, и всё это влияет на то, насколько один предмет кажется нам «похожим» на другой.

Археологи идут еще дальше: у них есть не только физические признаки находки — форма, материал и текстура, — но и опосредованные признаки: контекст и интерпретация. И поскольку аттрибуция артефактов — неочевидная и каждый раз уникальная задача, в ней могла бы пригодиться помощь цифровых технологий. Правда, проблема в том, что компьютер, в отличие от человека, располагает лишь изображением объекта (или несколькими) и, возможно, текстовым описанием. На этом всё.

Как обучить нейросеть, чтобы она помогла археологу

Первый подход — использовать предобученные сверточные нейросети, например ResNet. Эти сети хорошо улавливают геометрические особенности: углы, точки, общие очертания. Однако, как видно из требований археологии, этого часто недостаточно — форма предмета далеко не всегда определяет его культурную принадлежность.

Второй подход — использовать мультимодальные модели, такие как CLIP, которые обучаются на парах «изображение — текст». Такой метод позволяет выучить семантическое представление об объекте, что гораздо ближе к задачам археолога. Тем не менее, даже этот подход не способен заменить человека, который может взять предмет в руки, оценить его вес, фактуру, запах — или, как шутят археологи, даже попробовать на вкус.

Пути решения

Сейчас к изображениям фрагментов добавляют метаданные — такие, как место находки или материал — и дообучают модели на текстовых описаниях вроде «колесничный комплекс», уточняя и дополняя формулировки. Но даже этого недостаточно.

Такие меры не передают глубокие семантические связи, которые выстраивает археолог: технологии производства, миграции ремесленников, ритуальные функции. Без этих связей ИИ остаётся «слепым картографом», рисующим карты без понимания легенды.
Так что пока никакой магии — только археологи способны справляться с задачей атрибуции артефактов. Но мы стараемся создать инструменты, которые облегчат этот процесс.

Если вам интересно поучаствовать в решении настоящих археологических задач — присоединяйтесь к проекту на SIMILIS.IO. А если хочется узнать больше о цифровых помощниках в археологии, переходите к полной версии текста.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

ИИ видит черепок, археолог – историю: почему нейросети и ученые ссорятся о сходстве - Системный Блокъ

Как алгоритмы и люди по-разному измеряют «похожесть» артефактов и почему это важно Материал подготовлен в соавторстве: Олег Лашманов (ЕУСПб) и Егор Блохин

846 views17:02

2025/06/27 00:39:56
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>