Telegram Group Search
🤖 Дообучение больших языковых моделей для обнаружения уязвимостей

22 мая в 17:00 присоединяйтесь к научному семинару, где выступит Алексей Шестов (Sber AI Lab)!

На семинаре разберём публикацию в журнале IEEE Access по адаптации больших языковых моделей для поиска уязвимостей в коде:
▪️ поговорим об оптимальном режиме дообучения, выборе базовой модели, архитектуре
▪️ покажем, как ускорить дообучение для классификации в 13 раз с помощью батчей переменной длины без потери качества
▪️ обсудим сравнение с моделями на основе CodeBERT (относительный прирост - +5% ROC AUC и F1 на сбалансированных данных и +20% F1 — на несбалансированных)

Ждем ваши вопросы после выступления!

Подключайтесь по ссылке


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8🤩65
🚀 Новый курс по рекомендательным системам и RePlay — прокачай навыки персонализации данных!

В мире, где персонализация решает всё — от любимых фильмов до идеальных покупок — рекомендательные системы стали must-have инструментом. Хотите не просто понимать их, а создавать с нуля? Тогда этот курс для вас!

Sber AI Lab представляет курс по рекомендательным системам и open-source библиотеке RePlay!

🔘 Погружение в основы: от коллаборативной фильтрации до гибридных моделей
🔘 Практика на реальных кейсах, только работающие решения
🔘 Освоение RePlay — мощного инструмента для построения рекомендаций
🔘 Гибкий график — учитесь где угодно и когда удобно

🎁 Бонус: Сертификат от СберУниверситета для участников, кто успешно закроет все модули - для резюме и личной гордости

Зачем это вам?
Рынок рекомендательных систем растёт на 24,7% в год (Research Nester), и спрос на специалистов огромен. С этим курсом вы войдёте в топ востребованных профессионалов!


💻 Записаться на курс


#курс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
😍9🔥8🍾431👍1
🚀 Неявные нейронные представления (ННП) для 3D-генерации и реконструкции

29 мая в 17:00 приглашаем на научный семинар с Саввой Игнатьевым (Сколтех)!

Поговорим о новых методах для обучения ННП-гиперсетей для GAN, генерации выровненных 3D-моделей по текстовым описаниям и быстрого рендеринга поверхностей.

🔘 Почему это важно?
Предложенные подходы позволяют эффективно решать задачи реконструкции, генерации и модификации сложных структур, открывая перспективы для практического применения ННП в компьютерных графических приложениях.

После доклада — разберём тонкости и ответим на все вопросы!

💻 Подключайтесь по ссылке


#анонс
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍43💅2
⚡️ Мы на Яндекс × Data Fest 2025 в Белграде!

25 мая наши эксперты — Алексей Васильев и Миле Митрович — представили доклады на главной data-конференции в Сербии.

🔝 Алексей выступил с темой «OpenSource в Sber AI Lab. Библиотека для создания рекомендательных систем RePlay»:
- Показал нашу open-source библиотеку RePlay;
- Рассказал про другие open-source продукты Sber AI Lab;
- Поделился, как мы выводим наши инструменты в open-source и пишем научные статьи

Коллегам понравилось выступление — было много вопросов. Особенно из других выступлений запомнился доклад про «искусственный межславянский язык» (было интересно узнать про такое!). А ещё наша команда заняла 1-е место в ML-квизе на афтепати!


🔝 Миле выступил с докладом «From Tokens to Thinking: How Reinforcement Learning Fuels Reasoning in LLMs»:
- Разобрал RLHF и RLVR — как обучение с подкреплением улучшает языковые модели;
- Показал, как LLM учатся рассуждать и решать сложные задачи;
- Объяснил, почему это будущее генеративного ИИ

Одним из самых запоминающихся моментов стали доклады других спикеров — было полезно увидеть разные подходы в Data Science. Очень понравился нетворкинг: познакомились с коллегами из других компаний и обменялись опытом.


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒10🔥8💅6🦄2👍1👏1💋11
📰 Мы на Data Fest!

30 мая команда Sber AI Lab приняла участие в очном дне Sber x Data Fest 🚀

Андрей Савченко представил доклад на тему «Towards Emotional Artificial Intelligence». Запись выступления по ссылке

Кроме того, мы активно поучаствовали в постерной сессии.
Смотрите работы:
1. Sim4Rec: Flexible and Extensible Simulator for Recommender Systems for Large-Scale Data
2. Towards LLM-Driven Multi-Agent Pipeline for Drug Discovery: Neurodegenerative Diseases Case Study
3. LLM-KT: A Versatile Framework for Knowledge Transfer from Large Language Models to Collaborative Filtering
4. Video-based learning of sign languages: one pre-train to fit them all
5. RAGulator: Effective RAG for Regulatory Question Answering
6. InsideOut: Unifying Emotional LLMs to Foster Empathy
7. Device-Specific Facial Descriptors: Winning a Lottery with a SuperNet


А 31 мая Дмитрий Симаков выступил на открытом диалоге «Мифы и правда о соревновательном ML» на очном дне феста на площадке Avito

➡️ Запись конфы в Сбере
➡️ Постеры Sber AI Lab


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤‍🔥6💅331
🚀 Наши разработки на AI Journey — рассказываем о главном

В Санкт-Петербурге прошел один из ключевых дней конференции AI Journey от Сбера. Наши эксперты представили технологии, которые уже меняют подходы к работе с данными, рекомендательными системами и эмоциональным ИИ:

➡️ Юлия Беликова — RAGulator: эффективный RAG для регуляторных вопросов
Предложен улучшенный подход к Retrieval-Augmented Generation (RAG) для работы с нормативными документами. Гибридный поиск и модификация декодирования языковых моделей повышают точность и релевантность ответов

➡️ Алексей Гришанов — Sim4Rec: гибкий симулятор для рекомендательных систем
Представлен фреймворк для оценки рекомендательных алгоритмов и моделирования поведения пользователей. Sim4Rec умеет генерировать синтетические данные и предсказывать отклик пользователя на рекомендованные товары

➡️ Илья Шенбин — InsideOut: эмоциональные LLM для эмпатического общения
Разработано расширение для языковых моделей, которое улучшает распознавание и генерацию эмоций. В основе — система агентов: один анализирует эмоции, другой формирует ответ, а третий координирует их работу

➡️ Галина Зубкова - Мультимодальный диагностический ассистент Giga Doc
GigaDoc распознаёт ключевые биомаркеры человека: пол, возраст, пульс, артериальное давление, индекс массы тела, эмоциональное состояние, риск диабета второго типа, вариабельность сердечного ритма, уровень холестерина и другие параметры. Он также способен предлагать гипотезы о диагнозах на основе предоставленных фотографий.
В основе работы ассистента лежат такие технологии, как компьютерное зрение, машинное обучение и дистанционная фотоплетизмография


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥86👍3👏1😍11
🤖 Поучаствовали в международной форсайт-сессии AI Horizons о будущем искусственного интеллекта

В Санкт-Петербурге в рамках AI Journey прошла международная форсайт-конференция AI Horizons, где ведущие специалисты из 15+ стран обсудили будущее развитие ИИ. От нашей DS-команды принял участие Андрей Савченко, а еще к сессии присоединились ребята из AIRI, Сколтеха, МФТИ и Т-банка.

Участники сессии работали над общим видением будущего ИИ, обсуждали темы: от Human-Machine Interaction до Narrow AI и вопросов вычислительных ресурсов.

Такие ивенты — шанс не просто слушать мировую повестку, а влиять на неё и продвигать наши DS-решения.


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
84👍3
Наконец-то выложили запись разговора с Сашей Рыжкова -- уникальным 4x Kaggle GM
Мой первый опыт в роли интервьера)

Ниже анонс от коллег:

Что ждет AutoML и как побеждать на Kaggle? 🔥

На недавней конференции MTS True Tech Day состоялось крутое интервью, которое нельзя пропустить! Никита Зелинский (CDS MTS) пообщался с Александром Рыжковым — ex-руководителем LightAutoML, а ныне Avito R&D unit lead.

Обсудили самое мясо:
🏆 Победа на Kaggle AutoML Grand Prix 2024: инсайты и стратегии от победителя.
🚀 Будущее AutoML: куда движется индустрия и какие тренды нас ждут?
🤖 AI-агенты: как они уже меняют нашу работу и жизнь.

Получился концентрированный разговор о передовых технологиях и практическом опыте. Очень рекомендуем к просмотру!

▶️ Смотреть запись интервью: тыц
🎉8🔥5❤‍🔥3👏2
🔥 Очередь к ИИ-врачу: мы на GigaConf

25 июня в Москве прошла ежегодная технологическая конференция GigaConf

Наша команда представила GigaDoc цифрового медицинского ассистента
GigaDoc проводит телемедицинскую консультацию в два этапа: сначала модели компьютерного зрения анализируют лицо пользователя для бесконтактной оценки биомаркеров, затем агент на основе GigaChat формирует саммари, отвечает на вопросы и предлагает рекомендации. Цель технологии — сделать телемедицину доступнее для пользователя

Продукт демонстрировали наши DS — Амина Мифтахова и Иван Свиридов

👇 Что отметили наши ребята:
— GigaDoc вызвал ажиотаж: к стенду выстраивались нескончаемые очереди
— Люди активно взаимодействовали с ассистентом, делились отзывами и звали друзей
— Было круто собрать живую обратную связь от технического сообщества

📆 Амина и Ваня поделились впечатлениями:
Если люди ждут своей очереди опробовать продукт, приводят к нему знакомых, задают вопросы и предлагают идею, то это значит, что мы попали в точку. — говорит Амина.

Я рад, что у нас была возможность тестировать смелые идеи в реальных условиях - без прикрас, прямо на стенде, вживую. Это отличный способ проверить продукт, услышать настоящую обратную связь и завести разговор с аудиторией. — добавляет Ваня.


Итог — вдохновились, получили новые инсайты и вектор развития!


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥126🤩5🦄1👾1
🏆 Наша команда ai_lab_recsys заняла 2-е место в RecSys Challenge 2025!

…и 1-е место среди академических команд!

RecSys Challenge — это главное международное соревнование в области рекомендательных систем, которое проходит в рамках конференции ACM RecSys.
От нашей DS-команды на соревновании выступили Алексей Васильев, Антон Кленицкий, Артем Фаткулин, Антон Пембек и Дарья Денисова.

В этом году участникам нужно было создать универсальные поведенческие эмбеддинги пользователей на основе событий (покупки, просмотры, поиск и т. д.). С помощью полученных эмбеддингов решалось 6 различных задач, таких как отток пользователей и склонность к выбору определенных продуктов или категорий, 3 оставшиеся задачи были скрыты от участников.

🔥 Наше решение:
Наш подход — конкатенация разных типов эмбеддингов: от простых моделей вроде ALS и статистических фичей до нейросетевых автоэнкодеров и GRU. Такой гибрид дал сильный результат.

В соревновании участвовало более 100 команд и 400+ специалистов со всего мира. Мы обошли многих сильных соперников, включая индустриальные команды — например, команда Яндекса заняла 4-е место.

Следующий шаг — статья и презентация нашего решения на воркшопе конференции RecSys’25 осенью в Праге.

🔗 Лидерборд



#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥20🎉9🏆5💘2
🔝 Провели митап для клуба по ML в МИСИС!

В июне наша команда встретилась с ребятами из AI Knowledge club в МИСИС. Дмитрий Челобитченков и Дарья Денисова рассказали о нашей команде: чем мы занимаемся, какие крутые задачи решаем и как можно к нам присоединиться ⚡️

А ещё показали на практике, что строить рекомендательные системы на основе трансформеров — это не так сложно, как кажется! Всё благодаря нашей open-source библиотеке RePlay

Если тебе интересны рекомендательные системы и ты хочешь прокачаться в этой теме — напоминаем, что мы запустили бесплатный курс

💻 Записаться на курс


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6542👍1
2025/07/09 00:59:44
Back to Top
HTML Embed Code: