Telegram Group Search
Продолжаем изучать стэнфордский отчет AI Index Report 2025 (начало: 1, 2, 3, 4, 5, 6). Глава 5 «Science and Medicine» посвящена участию искусственного интеллекта в научных и медицинских исследованиях.

Если коротко: ИИ активно проникает практически во все сферы науки, охватывая диапазон от квантовой физики до создания новых химических веществ. И этот тренд будет только расти, открывая новые возможности и создавая новые риски.

1️⃣ ИИ продолжает ускорять научные открытия

🔸 Физика. ИИ-модели помогают анализировать данные экспериментов на ускорителях частиц.
🔸 Химия. ИИ-алгоритмы используются для расчета реакций и синтеза новых соединений.
🔸 Data science. Модели оптимизируют обработку больших массивов данных в астрофизике и экологии, например, для предсказания лесных пожаров.

Отчет также фиксирует расширение возможностей ИИ в междисциплинарных исследованиях, и прогнозирует появление виртуальных ИИ-лабораторий.

2️⃣ ИИ в медицине и биологии

В последние годы ИИ стал важным инструментом прорыва в диагностике, разработке лекарств и перспективных исследованиях по нескольким направлениям.

🔸 Протеиновый дизайн. LLM, такие как Aviary и AlphaProteo, оптимизируют последовательности белков для создания новых лекарств и материалов. 8,4% публикаций в области генерации белков основаны на применении ИИ, что в 2–3 раза выше, чем в других областях.
🔸 Картирование мозга. Проекты по созданию виртуальных лабораторий ИИ, например Virtual AI Lab, позволяют моделировать нейронные сети человеческого мозга, чтобы на их основе изучать неврологические заболевания.
🔸 Глюкозный мониторинг. LLM GluFormer применяется для непрерывного мониторинга уровня сахара в крови, улучшая лечение диабета.
🔸 Эволюционное моделирование. Модели Evolutionary Scale Modeling v3 (ESM3) и AlphaFold 3 сделали возможным предсказание изменения структуры белков, что критично для разработки терапии.
🔸 Генетика. ИИ активно применяется для изучения процессов транскрипции, трансляции и репликации ДНК/РНК.
🔸 Цитология. В 2023–2024 годах выросло количество моделей, анализирующих данные флуоресцентной и электронной микроскопии (перспектива для применения VLA), что позволяет глубже исследовать клеточные процессы.

3️⃣ Клиническая практика

С 2021 по 2024 годы США, Китай и страны ЕС значительно увеличили количество клинических испытаний с участием ИИ. Лидируют Штаты (>100 испытаний), за ними следуют Китай и Германия. Мы тоже писали о возможностях, которые открываются для ИИ в медицине.

Более 500 исследований в 2024 году показали эффективность обработки естественного языка (NLP) даже неспециализированных моделей при анализе медицинских записей. В 2024 году модель o1 от OpenAI на тесте MedQA установила новый эталонный показатель в 96,0% (+5,8% по сравнению с 2023 годом, +28,4% — с 2022-м).
Еще несколько выводов:

• GPT-4 в одиночку превосходит живых врачей (как применяющих ИИ, так и не) в диагностике сложных клинических случаев;
• ИИ лучше врачей справляется с выявлением рака и определением пациентов с высоким риском летального исхода;
• в то же время наилучшие клинические результаты достигаются при сотрудничестве ИИ и врача-человека.

Голосовые ИИ-ассистенты активно внедряются в амбулаториях и стационарах для автоматизации заказов и выдачи лекарств, кодирования и клинической поддержки в реальном времени.

Интересно, что в отчете не затронута тема удаленной и прецизионной хирургии, хотя это направление считается одним из самых перспективных и футурологичных примеров использования ИИ.

4️⃣ Риски и вызовы

Ключевая проблема, связанная с медицинским применением ИИ, касается врачебной этики и безопасности. Количество исследований по этой теме с 2020 по 2024 год увеличилось в 4 раза. Основные вопросы:
• прозрачность алгоритмов,
• защита конфиденциальных данных,
• предотвращение ошибок и галлюцинаций моделей при диагностике.

Еще один неожиданный вызов: датасеты клинических знаний для тестирования LLM, похоже, приближаются к насыщению. Назревает необходимость разработки более сложных методик оценки.

#AI #наука #медицина #тренды #аналитика #AI_index_report_2025

🚀 ©ТехноТренды
Поздравляем с началом лета! Наш традиционный инфодайджест — новости прошлой недели, которые выявляют или задают тренды.

⚡️ В 40 регионах России до конца 2026 года будет внедрена доставка с помощью БПЛА. В текущем году сеть охватит 8 субъектов федерации. Массовое использование дронов-доставщиков запланировано уже через месяц.
⚡️ 25 июня в Москве Сбер проведет ежегодную открытую конференцию GigaConf. Более 50 экспертов расскажут о трендах в области AI-технологий и реальных кейсах по внедрению GenAI. Присоединиться можно офлайн или онлайн.
⚡️ Компания Honor, «дочка» Huawei, объявила о выходе на рынок робототехники. Совместно с Unitree Honor выпустит гуманоидного робота, оснащенного ИИ собственной разработки.
⚡️ Платформа Odyssey развивает технологию интерактивного видео, генерируемого с помощью ИИ. Система рендерит кадры в реальном времени, адаптируясь под запросы пользователя. Пока эксперимент, но интерактивные фильмы на подходе.
⚡️ Cisco опубликовала отчет об использовании ИИ в службе поддержки. По прогнозу, к 2028 году 68% обращений в IT-саппорт будут обрабатываться ИИ-агентами. 93% пользователей уверены. что работа поддержки от этого станет быстрее и персональнее, 89% признают необходимость человеческого контроля в сложных ситуациях.
⚡️ Ну и напоследок — курьез. Функция AI Overviews в поисковике Google из-за странного глюка утверждала, что сейчас 2024 год. Когда пользователи обнаружили ошибку, компания оперативно пропатчила систему. Очередной звоночек по доверию к поисковому ИИ.

#дайджест #новости

🚀 ©ТехноТренды
1
🚀 Интересуетесь робототехникой, автоматизацией и передовыми технологиями?
Канал ТехноТренды — в тематической подборке каналов по роботизации! 🛠️🤖

👉 По ссылке можно сразу подписаться на все 40 каналов — в одном клике получите доступ к мощному потоку новостей, идей и кейсов из мира роботов:
https://www.group-telegram.com/addlist/jEtrqHYCm71hOGUy

💡 Каналы из подборки делятся опытом, рассказывают про реальное применение роботов, технологии, ИИ и разработку.

📬 Если вы админ канала на тему роботизации и хотите присоединиться — напишите @zimichev.

#Роботизация #Автоматизация #ПодборкаКаналов #ТехноТренды
Критическое мышление для сферы инноваций

Какова связь технологии и психологии? Она теснее, чем мы думаем. Например, эффективность изменений напрямую зависит от способности людей и организаций мыслить критически. В первую очередь — о себе самих.

Мы привыкли считать себя рациональными и логичными. На практике же мышление человека пронизано искажениями. Неопределённость, давление, эмоции, ограниченный опыт делают наше поведение далёким от рационального. А это прямо сказывается на принятии решений, бизнес-процессах и даже технологических паттернах.

Давайте поговорим о когнитивных искажениях, которые порождают устойчивые ошибки мышления и «заражают» даже искусственный интеллект.

1️⃣ Когнитивные искажения: враг инновационного мышления

Начнём с того, что рациональность человека — миф. Наш мозг стремится к экономии энергии и часто упрощает принятие решений за счёт эвристик — ментальных коротких путей. Однако эвристики формируют когнитивные искажения — устойчивые ошибки мышления. Эти искажения особенно мешают в условиях, где необходим выход за рамки шаблонов — т.е. в сфере инноваций.

🤷‍♂️ Пример 1: совещания и «ошибка одного эксперта»

В компаниях часто стратегические решения принимаются на основе обсуждения в группе экспертов. Однако, как показали исследования, даже у профессионалов с одинаковой квалификацией суждения подвержены огромному разбросу. Кроме того, в силу присущего человеческой психике конформизма группа часто склоняется к мнению одного, самого опытного. В результате совещания с участием одних и тех же людей могут давать диаметрально противоположные выводы по одному и тому же вопросу.

🤷‍♂️ Пример 2: инвесторы — нерациональные машины

Рынок — одна из ярчайших иллюстраций нерационального поведения. Инвесторы:
• переоценивают значение недавних событий (эффект доступности),
• склонны держать убыточные активы дольше, чем прибыльные (эффект владения),
• и нередко действуют эмоционально, особенно в условиях паники или ажиотажа.

А поскольку человек склонен подсознательно «рационализировать» свои эмоциональные импульсы, рынок становится площадкой иррациональных решений в маске осознанности.

2️⃣ ИИ и когнитивные искажения: масштабирование человеческих ошибок

Многие считают, что искусственный интеллект лишён эмоций и, следовательно, более объективен. Однако ИИ обучается на данных, созданных людьми. Это означает, что:
модели наследуют искажения, присутствующие в обучающих выборках;
модели могут проявлять «предвзятость середины» — тенденцию к усреднённым, безопасным решениям, особенно при недостатке контекста;
подтверждающие искажения в данных приводят к системной недооценке альтернативных гипотез.

👉 Без механизмов критической фильтрации это может привести к ошибкам в диагностике, предсказаниях и автоматизированных рекомендациях.

3️⃣ Как бороться с ошибками восприятия

Чтобы инновации не разрушались на этапе суждений и восприятия, необходимо системно развивать критическое мышление. Способствуют этому:
• регулярная саморефлексия, направленная на осознание когнитивных искажений;
расширение кругозора — знакомство с чужими точками зрения, междисциплинарность;
использование структурированных методик принятия решений, таких как «pre-mortem», «six thinking hats» или матрица рисков;
создание сред обсуждения, где допускается сомнение и несогласие, без страха социальной санкции.

4️⃣ Вывод: «будем же хорошо учиться думать!»

Призыв Паскаля не теряет актуальности. Мы живём в мире, где предположение о рациональности человека привело к институциональному самообману. Этот самообман масштабируется через технологии и алгоритмы, проникая уже на уровень искусственного интеллекта.

👉 Нужно учиться выстраивать мышление так же внимательно, как мы проектируем продукт. Без развитого критического мышления инновации либо остаются в стадии концепций, либо трансформируются в неэффективные или разрушительные решения.

📖 Полезную литературу по теме вы найдете в первом комментарии к этому посту.

#психология #ИИ

🚀 ©ТехноТренды
ЦИПР2025 и будущее отечественного IT

В Нижнем Новгороде со 2 по 5 июня проходит 10-я ежегодная конференция «Цифровая индустрия промышленной России» (мы ее недавно анонсировали). Во вторник на главной пленарной сессии выступил премьер Михаил Мишустин со своего рода отчетным докладом. Он подвел итог достижениям и представил планы на будущее.

Давние читатели нашего канала, возможно, помнят меметичный пост с ЦИПР 2022 года, где участники обсуждали, как удержать ИТ-специалистов внутри страны. С тех пор, по словам Мишустина, властям удалось изменить ситуацию и многого добиться.

📈 Что сделано

👉 Численность айтишников за 3 года не только восстановили, но и преумножили — до 992 тысяч человек (+50%).
👉 Создано 36 индустриальных центров компетенций, занимающихся внедрением отечественного ПО. В центрах разработано более 500 проектов, из них 140 уже реализуются.
👉 Объем рынка российских IT-решений вырос в 1,9 раза — до 4,5 трлн рублей. К 2030 году экономический рост в России будет более чем на 50% связан с цифровыми технологиями (1,47 из 2,75% ежегодного прироста ВВП).
👉 Доля IT-сектора в ВВП достигла 2,43%, инвестиции в отрасль составили 828 млрд рублей (+150%). На каждый бюджетный рубль — 7 рублей частных инвестиций. Ожидается, что общая отдача в 2025 году составит до 8,9 трлн рублей.
👉 Заработала господдержка: 70% компаний отметили позитивные изменения.

🇷🇺 Внедрение отечественного софта

К 2030 году ожидается полный переход 80% организаций на отечественное ПО. Расходы на закупки российских программ за 3 года выросли с 334 млрд до 1,1 трлн рублей. Доля компаний, уже использующих российское ПО:
• в финансах — 78%
• в управлении ресурсами — 59%
• в проектировании — 51%
• в производстве — 44%.

Мишустин пообещал ввести требования по обязательному использованию отечественного софта и особую маркировку для российского ПО, созданного с нуля и не зависящего от иностранных решений, даже опенсорса. Такие продукты получат приоритет при госзакупках.

🤖 Развитие национального ИИ

Как ожидает правительство, искусственный интеллект сыграет значительную роль в цифровой трансформации экономики.
👉 Выручка российского рынка ИИ-проектов в 2024 году достигла 305 млрд рублей — рост в 1,5 раза по сравнению с 2023-м.
👉 В рамках нацпроекта «Экономика данных и цифровая трансформация» выделено более 50 млрд рублей на разработку ИИ и платформы коллективного проектирования.
👉 Мишустин поручил проработать предложения по запуску единой платформы доступа разработчиков к датасетам.
👉 Особое внимание уделяется применению ИИ для задач обратного инжиниринга. Российские IT-специалисты показали примеры того, как искусственный интеллект помогает «копировать» импортные технологии — как встроенное ПО для станков с ЧПУ, так и промышленные техпроцессы.

🎯 Перспективы

Правительство планирует определить сроки перевода критической инфраструктуры на отечественное ПО — по словам Мишустина, «без спешки» и с минимальными рисками. Что делается в этом направлении:
• В 2025 году будет запущен публичный рейтинг «цифровой зрелости» (оснащенности IT-решениями) крупных компаний.
• Продолжатся усилия по привлечению молодежи в IT-сферу, например, через цифровые кафедры в вузах (уже работают в 100 университетах).

🔥 Выводы и вызовы

Ощутимые успехи цифровизации стали следствием взаимодействия между бизнесом и государством: научились договариваться. Отечественные вендоры предлагают IT-решения не хуже западных.

В то же время остро не хватает системности, координации. Слишком много поставщиков и конкурирующих программ, слишком мало межотраслевых стандартов и экосистем. Продукты плохо сочетаются между собой, отраслевые потребители ПО вынуждены брать на себя роль интеграторов и доработчиков.

Необходимо работать над развитием совместимости и более комплексным подходом к разработке ПО. Бизнесу нужны готовые ПАКи, пригодные к внедрению и масштабированию без «плясок с бубном».

#ЦИПР2025 #цифровизация #IT #тренды #технологический_суверенитет #Россия

🚀 ©ТехноТренды
Forwarded from GigaChat
Выпустили гайд по созданию корпоративных AI-агентов 🤖

Руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев на конференции «Цифровая индустрия промышленной России» представил практическое руководство по созданию AI-агентов для бизнеса

AI-агенты — полноценные работники, которые смогут анализировать документы, автоматизировать процессы и помогать командам быстрее запускать продукты


Внутри гайда:
✳️ этапы построения архитектуры
✳️ взаимодействие агентов между собой и с внешним миром
✳️ безопасность и масштабирование

🖥 Изучайте и скачивайте гайд по мультиагентным системам
Please open Telegram to view this post
VIEW IN TELEGRAM
AI и борьба за доступ к данным: что изменилось с 2024 года?

Чуть меньше года назад мы писали о нарастающих проблемах с доступом к данным для обучения ИИ-моделей. С тех пор ситуация значительно обострилась. Если в 2024 году основной тренд заключался в ужесточении ограничений через файлы robots.txt и сокращении доступности данных, то к 2025 году эти тенденции усилились.

Похоже, что технологическая сингулярность откладывается.
• В декабре 2024 года сооснователь OpenAI Илья Суцкевер заявил, что индустрия достигла «пика данных» и объем доступных датасетов практически исчерпан.
• В январе 2025 года Илон Маск подтвердил эти опасения:
«Мы фактически исчерпали общую сумму человеческих знаний для обучения ИИ».


Почему данные заканчиваются?

👉 Во-первых, объем накопленной человечеством информации не бесконечен, а ИИ осваивает ее с экспоненциальной скоростью. Исследования показывают, что качественные текстовые данные в Интернете могут закончиться к 2026 году, если не изменится темп их накопления.
График на картинке выше иллюстрирует прогнозы объемов публичного текста и наборов данных, созданных человеком, для LLM с 2020 по 2034 год.

👉 Во-вторых, дело не только в количестве данных, но и в их качестве. Модели ИИ требуют высокой точности, однако большая часть ежедневно генерируемых данных либо недоступна, либо не соответствует стандартам современных LLM. По оценке Epoch AI, общедоступные текстовые данные составляют около 300 трлн токенов, причем их уже начали обрабатывать по второму кругу, что снижает эффективность обучения.

👉 В-третьих, усиливаются запреты, касающиеся конфиденциальности и безопасности. По данным отчета «Consent in Crisis» (2024), доля недоступных для индексирования доменов за год выросла на 25%.

К чему приводит дефицит новых данных?

1️⃣ Ужесточение регулирования повышает зависимость компаний от дешевых, но низкокачественных данных, таких как контент из блогов или коммерческих сайтов, а это ухудшает надежность моделей. В стэнфордском отчете AI Index Report 2025 отмечается, что исчерпание доступных датасетов стало серьезно тормозить развитие медицинского ИИ.

2️⃣ Без качественных данных ИИ теряет точность, а новые проекты могут быть заблокированы на этапе разработки. Это угрожает не только технологическим инновациям, но и безопасности: для компенсации нехватки информации разработчики нередко используют частные данные, что повышает риски предвзятости, нарушений конфиденциальности, кибератак и т.д.

Что делать?

🔥 Одно из перспективных направлений — создание синтетических данных, искусственно сгенерированных с помощью алгоритмов, моделей или симуляций. Они имитируют реальные кейсы, но не содержат фактической информации из реального мира. Рынок таких решений, по прогнозам, к 2030 году вырастет до $2,3 млрд. IBM и Google уже внедряют технологии генерации данных через нейросети. Но результат сильно зависит от продуманности алгоритмов генерации и может даже привести к деградации моделей.

🔥 Еще один путь — легальное использование частных данных. OpenAI и другие компании начали платить авторам YouTube, TikTok и других соцсетей за неопубликованные материалы. Это позволяет формировать высококачественные датасеты, не нарушая прав владельцев информации.

🔥 Третья перспективная возможность — оптимизация моделей, позволяющая улучшить эффективность ИИ при ограниченных ресурсах. Малые языковые модели (SLM) демонстрируют, что успех зависит не от объема данных, а от их структуры и точности. Как бонус, это снижает энергопотребление и упрощает адаптацию моделей под специфические задачи.

Будущее ИИ: вызовы и возможности

Хотя ни один из методов не решает проблему полностью, их комбинация открывает простор для инноваций. Парадоксально, но дефицит данных может стать катализатором развития: разработчики вынуждены будут искать нестандартные подходы, такие как гибридные модели обучения или новые алгоритмы обработки информации. Как отметил один из экспертов, «ограничения стимулируют творчество» — и в случае с ИИ это особенно актуально.

#ИИ #тренды #ML

🚀 ©ТехноТренды
Где: Москва, Мещерский парк, 8:00
Когда: 13 июля 2025 года

Работаете в IT? Приглашаем вас на RUNIT by AGIMA — уникальный фестиваль, где спорт и технологии встречаются, чтобы создать площадку для нетворкинга, отдыха и новых знакомств. Как IT-конференция, только на природе и без докладов.

🔸 Кто может участвовать? Только те, кто имеет отношение к IT: сотрудники компаний, стартаперы, разработчики, маркетологи или специалисты поддержки, а также члены их семей.

🔸 Что в программе? Бег (3, 5. 10 и полумарафон, эстафета, командные зачеты, детские забеги), активности, лекции и возможность провести время с коллегами в неформальной обстановке.

Подробности и регистрация на официальном сайте: https://runit.digital/

#IT #спорт #фестиваль #нетворкинг #июль2025
1
Мы уже писали о примерах внедрения ИИ в тяжелой промышленности. Один из самых удачных кейсов такого рода демонстрирует ПАО «Северсталь». Его опыт интересен тем, что цифровые технологии в металлургии применены комплексно и масштабно, охватывая сразу многие сферы.

Началось с того, что в «Северстали» искали способ нарастить производство без лишних затрат и с сохранением качества. Обычный выход в таких случаях — оптимизация процессов, и для этого решили привлечь ИИ. В результате возник Центр искусственного интеллекта и машинного обучения «Северсталь Диджитал», а экономический эффект составил сотни миллионов рублей.

Методики внедрения ИИ

1️⃣ Анализ и выявление точек роста эффективности. Первый этап — сбор данных для обучения будущего ИИ. Специалисты по данным совместно с технологами и операторами изучают исторические данные (например, параметры работы оборудования за несколько лет), выявляют аномалии, ключевые факторы влияния на качество и производительность.

2️⃣ Разработка и тестирование моделей. После сбора данных создаются алгоритмы машинного обучения, которые тестируются на симуляционных датасетах. И только после успешного тестирования модель внедряется в реальные процессы.

3️⃣ Интеграция в производство. Для масштабирования решений «Северсталь» развивает собственную ИТ-инфраструктуру, включая платформы для обработки данных и вычислительные мощности. Например, система «Автотемп 2.0» на стане 2000 Череповецкого МК интегрирована в процессы управления темпом прокатки и выдачей заготовок из печи, обеспечивая автоматическое принятие решений.

Взаимодействие ИИ с технологическими процессами

На предприятиях концерна ИИ задействован сразу по нескольким ключевым направлениям.
🔸 Контроль качества продукции. Интеллектуальная система инспекции металлопроката, запущенная в 2025 году, автоматически обнаруживает и классифицирует отклонения на поверхности металла (например, трещины, включения). Решение направляет оператору информацию о дефектах, что позволяет оперативно корректировать процесс и снизить количество брака.
🔸 Оптимизация производственных агрегатов:
• ИИ-алгоритмы скорректировали режимы работы агрегата непрерывного горячего цинкования, за первые три месяца повысив производительность на 3,4% и дав экономию > 100 млн руб.;
• применение системы «Автотемп 2.0» позволило дополнительно произвести 65,5 тыс. т металлопроката в 2023 году, сэкономив 184,5 млн руб.
🔸 Предиктивное обслуживание и безопасность:
• робособака Deep Robotics тестируется на территории Череповецкого МК для мониторинга состояния оборудования и выявления потенциальных поломок;
• используются AI-решения для прогнозирования износа инструментов и планирования ремонта до фактической поломки, что минимизирует затраты на обслуживание.
🔸 Обучение персонала через VR. Платформа «Метасфера», зарегистрированная в Роспатенте, применяется для тренировок операторов на VR-тренажерах. Это ускоряет адаптацию сотрудников к новым технологиям и снижает ошибки при работе с ИИ-системами.

Перспективы, вызовы и тренды

«Северсталь» продолжает развивать направления ИИ-автоматизации, включая переход от AI-ассистентов к полностью автономным решениям. Затрудняет эту работу несколько аспектов — все они типичны для цифровизационных процессов в промышленности:
• сложность адаптации ИИ-решений под специфику металлургических процессов;
• отсутствие четких регламентов юридической ответственности за ошибки алгоритмов;
• человеческий фактор — сотрудникам иногда тяжело перестроиться на новые методы работы и освоить высокотехнологичное оборудование.

Тем не менее, уже очевидно, что ИИ стал необходимым фактором роста не только в торгово-финансовом, но и в реальном секторе. Кроме «Северстали» успешно внедряют у себя ИИ-технологии «Норникель», ТМК, «Полюс» и другие крупные горно-металлургические компании. А всего в России, по мнению вице-премьера Дмитрий Чернышенко, экономический эффект от использования ИИ в разных отраслях к 2030 году составит 11 трлн рублей.

#ИИ #промышленная_роботизация #внедрение #металлургия

🚀 ©ТехноТренды
Forwarded from Complete AI
⚡️⚡️⚡️На прошлой неделе мы в AIRI зарелизили очень крутую работу в рамках трека «Генеративное проектирование» — cadrille: Multi-modal CAD Reconstruction with Online Reinforcement Learning

Архитектура представляет собой мультимодальную LLM, которая на вход может принимать облака точек, изображения и текст, а на выходе генерировать код операций, восстанавливающих некоторый CAD объект (например, какую-то инженерную деталь). То есть мы одновременно решаем задачу понимания сложных модальностей и задачу синтеза последовательности операций, необходимых для её восстановления по фото и облаку точек.

В дополнение добавили несколько вариантов онлайн RL (DPO и Dr. CPPO), что позволило значительно улучшить метрики и выбить SoTA на самых известных бенчмарках по восстановлению CAD моделей: DeepCAD, Fusion360 и CC3D💪

📍Статья — https://arxiv.org/abs/2505.22914
📍GitHub
📍
Hugging Face
📍
На Papers With Code уверенная SoTA на DeepCAD бенчмарке

Буду очень рад обратной связи и предложениям по развитию, тестированию и будущему внедрению!

P.S. На прошедшем 30 мая DataFest’е в Сбере я рассказал подробно про наши исследования в области генеративного проектирования и кратко о модели, что вызвало большой интерес у представителей промышленности. Поэтому если вы ещё не слышали про cadrille, то обязательно расскажите своему другу - инженеру, ему особенно понравится😉

@complete_ai
ReIndustry Expo — выставка технологий и IT-решений для модернизации производства и логистики.

Где: Москва, Тимирязев Центр (м. Петровско-Разумовская)
Когда: 24–26 июня 2025
Промокод для бесплатной регистрации: RE718TGM4

Подробности и регистрация на сайте: https://reindustry-expo.ru/

🚀 ©ТехноТренды
Технологии vs. безопасность: проблема доверия к ИИ

Пользуетесь нейросетями? Уверены, что пользуетесь 🙂. По данным опроса, проведенного порталом Hi-Tech Mail (май 2025), 60% россиян положительно относятся к использованию ИИ в работе и учебе.

Многие уже привыкли по всем вопросам соваться не в Google, а в ChatGPT. Чат-боты находят нам информацию в сети, ставят диагноз по симптомам (иногда более эффективно, чем врачи) и выполняют кучу других услуг. Некоторые люди даже превратили их в своих эмоциональных партнеров.

Свыше 70% российских ИТ-специалистов применяют нейросети не реже раза в неделю, 62% из них оценивают свой уровень доверия к ИИ как высокий.

Но готовы ли вы столкнуться с темной стороной нейросетей? А придется (скорее всего, уже не раз пришлось 😉). И с этим надо что-то делать.

Индустрия дипфейков

«Искусство по-прежнему в большом долгу» (c). Модели часто галлюцинируют, выдают желаемое за действительное и просто выдумывают данные. Увы, они умеют это делать очень убедительно — и подставляют доверившегося пользователя. Но злого умысла тут нет — всего лишь сырость технологии.

Хуже, когда ИИ сознательно используется для обмана и манипуляций. Мы уже писали о мошенничествах с использованием Voice cloning и росте киберпреступности. Слово «дипфейк» давно закрепилось в нашем словаре. И применение дипфейков расширяется, а выявить их оказывается весьма сложно даже с помощью нейросетей. Это вам не студента с фальшивой курсовой заловить.

Вот несколько свежих скандалов.

💥 В Великобритании адвокаты использовали в судебных процессах фальшивые дела, сфабрикованные нейросетями, и ссылались на них как на реальные прецеденты.

💥 Во время протестов в Кении летом 2024 года DFRLab выявила операцию по оказанию влияния. В соцсетях разошлись сгенерированные ИИ «фото», на которых демонстранты шли с российскими флагами, а молодые люди одного пола целовались между собой. Поднялся шум, но нашлись несколько энтузиастов, разоблачивших фейк.

💥 Обратный пример. Во время идущих сейчас беспорядков в Лос-Анджелесе нейросети провалили факт-чекинг: приняли за фейк опубликованные губернатором Калифорнии фото солдат Национальной гвардии, спящих на полу зданий, взятых ими под охрану. На самом деле фотографии реально были сделаны на месте событий репортером San Francisco Chronicle, и газета подтвердила подлинность снимков.

Тревожные тренды

KeepNet публикует пугающую статистику: в 2023 году количество инцидентов, связанных с фишингом и мошенничеством с использованием дипфейков, выросло на 3000%. Наиболее целевой сектор — онлайн-СМИ. И как видим, даже продвинутые ИИ-модели часто не могут достоверно распознать подделку или же подтвердить подлинность изображений и видео.

Развивается тенденция использования инструментов ИИ околоправительственными структурами разных стран для поддержки ИПСО в различных частях света. Можно говорить о возникновении целой индустрии, направленной на подтасовку реальности и манипуляции с сознанием.

Тренд неприятный, особенно на фоне того, что разработчики AI всё активнее внедряются в структуры власти. Например, в США OpenAI и Anthropic, которые когда-то позиционировали себя как ответственные и осторожные исследователи, теперь увеличивают персонал и бюджеты на лоббирование в Вашингтоне, добиваясь новых госконтрактов. И вообще администрация Трампа делает большую ставку на ИИ, хотя технология, как мы видим, вызывает большие вопросы.

🤷‍♂️ ИИ — это инструмент, который едва появился, но уже угрожает выйти из-под контроля. Мы можем не заметить, как окажемся под властью одновременно Скайнета и Матрицы: жизнь в придуманном нейросетями мире, пока реальностью управляет неуправляемый ИИ. Пока процесс не зашел слишком далеко, необходимы барьеры, способные защитить человека и общество от киберунижения. Работа в этом направлении ведется, и о ней — в следующем посте.

#кибербезопасность #тренды

🚀 ©ТехноТренды
Forwarded from Sber AI
This media is not supported in your browser
VIEW IN TELEGRAM
Собрано в России: 8 датасетов от отечественных разработчиков💡

Распознавать эмоции, предсказывать структуру молекул, понимать жестовый язык и культурный контекст — всему этому нейросети учатся на наборах данных. Их собирают и размечают большие команды исследователей. В День России рассказываем об отечественных датасетах и корпусах.

Golos и Dusha

💳 Golos — это корпус аудиозаписей русской речи с транскрипциями объёмом 1 240 часов. Используется для обучения моделей распознавания речи. А с помощью датасета Dusha нейросети учатся определять эмоции в речи. В нём собраны короткие аудиофрагменты с аннотациями четырёх типов настроения: грусть, радость, злость или нейтральная эмоция. Оба корпуса созданы командой Сбера.

Национальный корпус русского языка

✉️ Крупнейший и наиболее репрезентативный корпус текстов на русском языке, созданный специалистами из Института русского языка РАН, МГУ и СПбГУ. В него входят художественные произведения, научные статьи, документы и публицистика, расшифровки устной речи, а также переводы. Общий объём — более 2 млрд токенов. Лингвисты разметили все тексты с высокой точностью. Это позволяет качественно обучать LLM с учётом русской грамматики, синтаксиса и культурного контекста.

Slovo

💚 Крупнейший датасет русского жестового языка от Сбера. С его помощью модели компьютерного зрения обучаются распознавать дактилемы — буквы жестового алфавита. Cостоит из 20 400 видео, записанных с помощью 194 носителей языка и экспертов.

∇²DFT

👨‍💻 Набор данных о квантовых свойствах и пространственной геометрии атомов в 1,9 млн молекул. На нём модели учатся прогнозировать свойства химических соединений. Датасет и бенчмарк на его основе создали специалисты из Института AIRI, Сколтеха и Санкт-Петербургского отделения Математического института имени В.А. Стеклова (ПОМИ) РАН.

Skoltech3D

💻 Датасет, с помощью которого модели учатся реконструировать поверхности сложных 3D-объектов. Содержит около 1,4 млн снимков 107 пространств и объектов под 14 различными видами освещения. Данные собрали исследователи из Сколтеха, AIRI и МФТИ.

Museum exhibits dataset

⭐️ Библиотека содержит около 16 000 размеченных изображений экспонатов из открытого музейного каталога Минкульта России. На этих данных модели обучаются распознавать объекты и анализировать визуальное сходство.

MosMedData Chest CT Scans

🔥 В этом датасете собрано более тысячи КТ-снимков лёгких российских пациентов, перенёсших COVID-19. Все данные обезличены. С помощью снимков модели обучаются распознавать признаки заболеваний.

❤️ — если хотите больше историй о российских AI-разработках
Please open Telegram to view this post
VIEW IN TELEGRAM
🧬 Вышла модель Boltz-2 — open-source альтернатива AlphaFold 3 для предсказания взаимодействия белков и лекарств

Разработчики выкатили Boltz-2 — мощную и открытую биомодель для структурной биологии и дизайна лекарств. В отличие от AlphaFold 3 от Google DeepMind (веса закрыты, доступ — только по заявке), здесь всё выложено в открытый доступ: и модель, и код.

📌 Что умеет Boltz-2?
• Строит 3D-структуры белков, РНК/ДНК и лигандов в одном комплексе.
• Прогнозирует силу связывания (аналог Ki / Kd / IC50) — можно сразу понять, насколько эффективно молекула будет взаимодействовать с мишенью.
• Работает быстро: всего ~20 секунд на одной видеокарте (в отличие от FEP-методов, которые считают часами или днями).

🔬 На практике это значит:
• Можно использовать Boltz-2 для виртуального скрининга миллионов соединений — отфильтровывать слабые кандидаты сразу.
• Отлично подходит для ранжировки похожих соединений на стадии hit-to-lead.
• Совмещается с GFlowNet — модель сама предлагает перспективные молекулы для синтеза.

💡 По сути, Boltz-2 — это универсальный движок для молекулярного дизайна, заточенный под 3D-структуры и предсказание силы связывания.

Ссылки:
💻 GUI и инструкция по локальному запуску
🧠 Моделька на Hugging Face
🧾 Официальная статья
📦 Репозиторий с кодом
🧵 FAQ и разбор технологии
🌐 Официальный анонс


🚀 ©ТехноТренды
Технологии vs. безопасность: как защититься от фейков ИИ

Плохая новость: мы от природы склонны верить своим глазам и ушам, и это усложняет выживание в быстро меняющейся информационной среде. Сегодня любой может сгенерировать реалистичный фейк-контент за считанные минуты и за копейки — например, видео с участием «бабушки и носорога» обошлось менее чем в $50. Угроза однажды оказаться в «информационном аквариуме», где фейки заменяют реальность, всё более ощутима. Что же делать?

1️⃣ Самообразование

Первое, что требуется — повышать собственную цифровую грамотность.
👉 Подготовленный человек более склонен фильтровать интернет-контент, как в прежние времена люди фильтровали то, что пишут в газетах, говорят по радио и ТВ. (Хотя всё равно клевали на фейки: достаточно вспомнить радиорепортаж Орсона Уэллса, мем «Ленин — гриб» или жанр мокьюментари).
👉 Полезно знать простые приемы для выявления подделок.
👉 Правильной стратегией будет минимизация своего цифрового следа: чем меньше ваших личных данных присутствует в Сети, тем труднее мошенникам использовать их для ИИ-атак.

2️⃣ Ответственный ИИ

Правительства и корпорации тоже осознают угрозу, поэтому предлагают свой «ответ сверху» — концепцию RAI (Responsible AI). Государству нужно избежать хаоса и сохранить контроль над инфопотоками, а бизнесу — защитить репутацию. Усилия по разработке международных стандартов, таких как C2PA, и контролю за распространением фейк-генераторов будут нарастать.

3️⃣ Технология против технологии

Классическая борьба «меча» и «щита» в цифровую эпоху никуда не делась. Ирония в том, что эффективно разоблачить ИИ, особенно в реальном времени, можно только с помощью ИИ — это и есть определяющий тренд противостояния.

Два основных подхода к проверке подлинности контента:

Анализ происхождения (provenance-based)

Исследуются метаданные: «водяные знаки», временные метки, GPS-координаты, история редактирования и криптографические хеши файлов. Эффективности метода способствуют идеи RAI и законы, обязывающие маркировать искусственно сгенерированный контент.

Минусы:
▫️злоумышленники быстро адаптируются, появился рынок услуг по удалению и фальсификации водяных знаков;
▫️эффективность подхода зависит от доступа к подлинным образцам медиа, что сложно в условиях реального времени.

Анализ выводов (detection-based)

Исследуется сам медиаконтент на наличие артефактов. Для этого применяются:
🔸 NLP-модели (BERT, RoBERTa), анализирующие структуру текста и семантику для выявления дезинформации .
🔸 RAG (Retrieval-Augmented Generation) — модели сверяют факты с надежными источниками, такими как государственные реестры или научные базы данных.
🔸 Компьютерное зрение: сверточные нейросети (CNN) анализируют микровыражения лица, изменения освещения и незаметные окклюзии (например, пульсацию крови под кожей).
🔸 Аудиоанализ: модели сравнивают частотные характеристики голоса с биометрическими эталонами, выявляя несоответствия в дрожании голосовых связок или артикуляции.

Минусы:
▫️Ресурсоемкость решений (тут на помощь приходят облачные сервисы).
▫️Зависимость от качества модели обнаружения. Если создаются новые генеративные модели (например, GAN'ы нового поколения), старые детекторы могут их не распознать.
▫️Высокая вероятность ложных срабатываний. Детекторы могут ошибочно помечать реальный контент как фейк и наоборот.

🤷‍♂️ Есть и общий минус для обоих подходов — ограниченная применимость. Технологии обнаружения работают только постфактум, когда фейковый контент уже создан. Они не предотвращают его создание или распространение.

В таких условиях возвращаемся к тому, с чего начали: эффективность защиты зависит не только от алгоритмов, но и от способности общества адаптироваться к новой реальности, где правда и вымысел сливаются в единое целое.

🎯 Ссылки:
10 лучших инструментов для обнаружения ИИ
Intel® FakeCatcher (пока доступен только организациям)
Microsoft Video Authenticator
Sensity AI
Detect Fakes

#кибербезопасность #тренды

🚀 ©ТехноТренды
Умеет ли думать искусственный интеллект? Статья Apple вызвала бурную дискуссию в индустрии

LRM — большая «рассуждающая» (reasoning) модель — маркетинговый термин, в который разработчики вкладывают свое понимание, а публика свое. При этом процесс ризонинга на самом деле изучен очень мало. Считается, что чем больше бюджет токенов, тем выше качество ответов. Но не всё так однозначно ©.

Иллюзия мышления?

Накануне очередной конференции WWDC эксперты Apple выпустили статью «The Illusion of Thinking», посвященную результатам тестирования передовых LRM, таких как OpenAI o1 и o3, DeepSeek R1, Claude 3.7 Sonnet и др. в сравнении с обычными LLM.

Целью тестов было проверить, как работает ризонинг на простых алгоритмических головоломках: «Ханойская башня», «Переправа через реку» и «Мир блоков». Условия задач постепенно усложнялись, оценивалось качество «мышления» при увеличении нагрузки.

Тесты показали следующее:

1️⃣ Резкое падение точности по мере усложнения задач. При превышении определенного уровня сложности (например, при добавлении очередного диска в Ханойской башне) способность моделей решать задачи падает до нуля.

2️⃣ Столкнувшись с трудной задачей, LRM резко сокращают затраты ресурсов на рассуждения — как ленивые студенты, пасующие перед трудностями. Здесь есть нюансы:
• С простыми задачами «нерассуждающие» LLM часто справляются лучше. LRM склонны к overthinking’у: быстро получив правильный ответ, не фиксируют его и продолжают «думать», пока не израсходуют бюджет токенов.
• На задачах средней сложности LRM выигрывают благодаря механизмам цепочек рассуждений.
• На сложных задачах падает эффективность всех моделей, что говорит о фундаментальных ограничениях масштабируемости.

3️⃣ Неспособность следовать четким алгоритмам. Даже имея алгоритм решения задачи, модели терпят неудачу на тех же уровнях сложности.

4️⃣ Непоследовательность ризонинга. Модели могут успешно решить «Ханойскую башню» с множеством шагов, но провалиться на более простой «Переправе».

Исследователи Apple делают вывод: системы ИИ не обладают истинной способностью к рассуждению. Их работа основана на запоминании паттернов и статистическом прогнозировании, а не на универсальном логическом анализе. Пресловутый AGI всё еще остаётся фантастикой.

Или иллюзия иллюзии?

Конкуренты нашли, что ответить. Вышла контр-статья с критикой методов исследования Apple. Если кратко — тестировщики намеренно «валили» LRM:
• автоматическая система оценки засчитывала ответ, только если модель явно перечисляла все шаги решения, и игнорировала решения без «росписи» действий;
• в тестах присутствовали заведомо нерешаемые задачи (например, о переправе N ≥ 6 для трехместной лодки), но модели всё равно получали нулевой балл за «провал»;
• моделям выдавали слишком мало токенов, что мешало полноценно рассуждать. И т.д.

Забавно, что один из двух соавторов дисса — Claude Opus от Anthropic. LRM вписалась за LRM ))

Главное — вовремя задать вопрос

Исследование Apple вышло хоть и спорным, но очень своевременным, чтобы вернуть наше внимание к некоторым ключевым темам.

👉 То, что называется «рассуждениями» ИИ, по сути является высокоразвитой формой спекуляции шаблонами. (Это было понятно и раньше, но маркетинг всех оглушил). Необходимо более критично оценивать «связность» и «логичность» выводов моделей, искать объективные критерии оценки, изучать механизмы самокоррекции моделей, выявлять фундаментальные недостатки и явные ограничения масштабирования.

👉 Концепция «сопутствующего интеллекта» как сценарий на ближайшее будущее более реалистична, чем гипотетический AGI. Ограничения LRM актуализируют необходимость участия человека в работе ИИ.

👉 Достижение AGI, как очевидно, невозможно за счет простого масштабирования LRM. Прежде надо разобраться, что реально происходит в «уме» нейросетей, понять причины ограниченности моделей, а потом уже, возможно, создать более надежный и по-настоящему мыслящий ИИ.

#ИИ #LRM #исследования

🚀 ©ТехноТренды
👍1
2025/10/26 07:45:50
Back to Top
HTML Embed Code: