О, на Hugging Face Spaces теперь есть отдельный стор для MCP
Напоминаем, что HF Spaces – это огромный стор ИИ-приложений, в котором можно найти себе тулзу под любую задачу. Мы писали о нем тут.
Так вот теперь там можно легко находить также MCP. Просто нужно выбрать фильтр «MCP Compatible», и вы получите кучу готовых серверов на любой вкус.
Главное – проверяйте на базовые уязвимости, всякое бывает. А Hugging Face как всегда большие молодцы.
huggingface.co/spaces
Напоминаем, что HF Spaces – это огромный стор ИИ-приложений, в котором можно найти себе тулзу под любую задачу. Мы писали о нем тут.
Так вот теперь там можно легко находить также MCP. Просто нужно выбрать фильтр «MCP Compatible», и вы получите кучу готовых серверов на любой вкус.
Главное – проверяйте на базовые уязвимости, всякое бывает. А Hugging Face как всегда большие молодцы.
huggingface.co/spaces
This media is not supported in your browser
VIEW IN TELEGRAM
Тренд на игру в Pokémon докатился и до OpenAI
Они поставили играть o3, лайв трансляцию прохождения можно посмотреть на Твиче здесь. Сбоку на панели также доступны некоторые шаги ризонинга, можно почитать, как модель анализирует карту, обдумывает план и тд.
Напоминаем, что ранее в Pokémon ставили играть Sonnet 3.7 и Gemini 2.5 Pro.
Gemini стала первой моделью, прошедшей игру полностью, ей потребовалось несколько сотен часов. Правда, там были некоторые доп.хаки типа специальной предобработки карты и использования отдельных агентов для решения головоломок (наш пост).
Непонятно, есть ли что-то такое в текущем сетапе с o3. Но все равно очень интересно, как моделька справится
Они поставили играть o3, лайв трансляцию прохождения можно посмотреть на Твиче здесь. Сбоку на панели также доступны некоторые шаги ризонинга, можно почитать, как модель анализирует карту, обдумывает план и тд.
Напоминаем, что ранее в Pokémon ставили играть Sonnet 3.7 и Gemini 2.5 Pro.
Gemini стала первой моделью, прошедшей игру полностью, ей потребовалось несколько сотен часов. Правда, там были некоторые доп.хаки типа специальной предобработки карты и использования отдельных агентов для решения головоломок (наш пост).
Непонятно, есть ли что-то такое в текущем сетапе с o3. Но все равно очень интересно, как моделька справится
Вау, Google раскатали приложение для локального запуска моделек на телефоне
Оно абсолютно бесплатное, опенсорсное и поддерживает даже мультимодальные модели. Инструкция, как запустить:
1. Заходим в репозиторий Google AI Edge Gallery, заходим в Releases и скачиваем файл .apk. Это для Android, на айфоны будет позже.
2. Заходим в приложение, скачиваем одну из моделей оттуда или загружаем свою.
3. Все, теперь вы можете пользоваться этой моделью локально, то есть оффлайн и только на ресурсах вашего телефона.
Особенно хорошо это работает с новыми Gemma 3n, адаптированными специально под локальный запуск.
Оно абсолютно бесплатное, опенсорсное и поддерживает даже мультимодальные модели. Инструкция, как запустить:
1. Заходим в репозиторий Google AI Edge Gallery, заходим в Releases и скачиваем файл .apk. Это для Android, на айфоны будет позже.
2. Заходим в приложение, скачиваем одну из моделей оттуда или загружаем свою.
3. Все, теперь вы можете пользоваться этой моделью локально, то есть оффлайн и только на ресурсах вашего телефона.
Особенно хорошо это работает с новыми Gemma 3n, адаптированными специально под локальный запуск.
Знаете функцию «Войти с помощью Google / Apple / др»? Скоро так можно будет входить с помощью учетки ChatGPT
Это не просто отдаленные планы компании: вчера OpenAI уже запустили форму поиска разработчиков, которые заинтересованы интегрировать вход по ChatGPT на свои платформы.
Документация по тому, как это будет работать, тут.
Кажется, что это минорная фича, но на самом деле это большой шаг в конкуренции с Google, Microsoft и другими. Чем шире такие интеграции – тем больше OpenAI становится похожа на крупную корпорацию и захватывает внимание людей.
Это не просто отдаленные планы компании: вчера OpenAI уже запустили форму поиска разработчиков, которые заинтересованы интегрировать вход по ChatGPT на свои платформы.
Документация по тому, как это будет работать, тут.
Кажется, что это минорная фича, но на самом деле это большой шаг в конкуренции с Google, Microsoft и другими. Чем шире такие интеграции – тем больше OpenAI становится похожа на крупную корпорацию и захватывает внимание людей.
Media is too big
VIEW IN TELEGRAM
Дуров 🤝 Маск
Только что стало известно, что уже этим летом Grok встроят в Telegram. И это будет не просто официальный бот, а большая колаба:
– Можно будет задавать модели вопросы прямо из поиска в тг
– Агент сможет модерировать чаты и помогать писать сообщения,
– … проверять и суммаризировать посты,
– … и даже генерировать картинки
За такую интеграцию Telegram получит 300 миллионов долларов + долю в акционерном капитале xAI + 50% с каждой проданной через тг подписку на Grok.
Жирно, конечно. Неудивительно, что на фоне новости TON уже взлетел на 23 процента💵
UPD: Маск опроверг информацию.
UPD 2: Дуров уточнил: согласились в принципе, остались формальности.
– Можно будет задавать модели вопросы прямо из поиска в тг
– Агент сможет модерировать чаты и помогать писать сообщения,
– … проверять и суммаризировать посты,
– … и даже генерировать картинки
За такую интеграцию Telegram получит 300 миллионов долларов + долю в акционерном капитале xAI + 50% с каждой проданной через тг подписку на Grok.
Жирно, конечно. Неудивительно, что на фоне новости TON уже взлетел на 23 процента
UPD: Маск опроверг информацию.
UPD 2: Дуров уточнил: согласились в принципе, остались формальности.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи Яндекса разработали и выложили в опенсорс YaMBDa — один из самых больших датасетов в области рекомендательных систем.
В нем 4,79 миллиардов обезличенных пользовательских действий на Яндекс Музыке. Для RecSys это редкость, так как качественных открытых датасетов в этой области дефицит. Тем более очень нечасто такие данные публикуют коммерческие платформы.
Структура YaMBDa (YAndex Music Billion-interactions DAtaset): внутри прослушивания, лайки, дизлайки (то есть неявный фидбэк), некоторые характеристики треков и флаг is_organic, который означает, было ли действие пользователя органическим или вызванным рекомендациями.
Файлы предоставляются в формате Apache Parquet с глобальным временным сплитом. Опять же, удобно, потому что в отличие от Leave-One-Out сохраняется глобальная временная последовательность и исключаются лики.
Допом к датасету идет набор бэйзлайнов (MostPop, DecayPop, ItemKNN, iALS, BPR, SANSA, SASRec). Можно не реализовывать базу, а сразу сравнивать ваши алгоритмы с существующими метриками.
Хабр | Hugging Face
В нем 4,79 миллиардов обезличенных пользовательских действий на Яндекс Музыке. Для RecSys это редкость, так как качественных открытых датасетов в этой области дефицит. Тем более очень нечасто такие данные публикуют коммерческие платформы.
Структура YaMBDa (YAndex Music Billion-interactions DAtaset): внутри прослушивания, лайки, дизлайки (то есть неявный фидбэк), некоторые характеристики треков и флаг is_organic, который означает, было ли действие пользователя органическим или вызванным рекомендациями.
Файлы предоставляются в формате Apache Parquet с глобальным временным сплитом. Опять же, удобно, потому что в отличие от Leave-One-Out сохраняется глобальная временная последовательность и исключаются лики.
Допом к датасету идет набор бэйзлайнов (MostPop, DecayPop, ItemKNN, iALS, BPR, SANSA, SASRec). Можно не реализовывать базу, а сразу сравнивать ваши алгоритмы с существующими метриками.
Хабр | Hugging Face
Хабр
Исследователи Яндекса выложили Yambda — один из крупнейших в мире датасетов для развития рекомендательных систем
Привет! Меня зовут Александр Плошкин, я руковожу группой развития качества персонализации в Яндексе. Сегодня мы открываем доступ к одному из крупнейших рекомендательных датасетов —...
DeepSeek обновили R1
В официальном аккаунте на WeChat разработчики написали, что R1 получила «минорное тестовое обновление», и что попробовать его уже можно на официальном сайте.
Хотя обновление и минорное, пользователи пишут, что теперь рассуждения модели вышли на уровень o3 и стали глубже и дольше (кто-то даже делится неподтвержденными скриншотами 25 минут рассуждений).
Официальных бенчмарков пока нет. Ждем. Если это действительно уровень o3, то какой будет r2?
В официальном аккаунте на WeChat разработчики написали, что R1 получила «минорное тестовое обновление», и что попробовать его уже можно на официальном сайте.
Хотя обновление и минорное, пользователи пишут, что теперь рассуждения модели вышли на уровень o3 и стали глубже и дольше (кто-то даже делится неподтвержденными скриншотами 25 минут рассуждений).
Официальных бенчмарков пока нет. Ждем. Если это действительно уровень o3, то какой будет r2?
Кто обучает будущих архитекторов AGI
Каждый второй стартап пишет «AI-native» в питч-деке, но остаётся вопрос: кто вообще готовит тех, кто сможет строить такие системы?
Это преподаватели и эксперты-практики, которые не только работают в индустрии, но и делятся знаниями со студентами. Они читают курсы, вытаскивают студентов в реальные проекты и актуализируют программы в университетах.
Yandex ML Prize 2025 как раз про таких — про тех, кто стоит у истоков индустрии, хотя их обычно не видно в релизах и исследованиях. В этом году премия от Яндекса вручает гранты и поддерживает преподавателей, которые формируют будущую экосистему ML в России.
Прием заявок на премию открыт до 22 июня. Категории: от преподавателей со стажем до руководителей целых ML-программ.
Каждый второй стартап пишет «AI-native» в питч-деке, но остаётся вопрос: кто вообще готовит тех, кто сможет строить такие системы?
Это преподаватели и эксперты-практики, которые не только работают в индустрии, но и делятся знаниями со студентами. Они читают курсы, вытаскивают студентов в реальные проекты и актуализируют программы в университетах.
Yandex ML Prize 2025 как раз про таких — про тех, кто стоит у истоков индустрии, хотя их обычно не видно в релизах и исследованиях. В этом году премия от Яндекса вручает гранты и поддерживает преподавателей, которые формируют будущую экосистему ML в России.
Прием заявок на премию открыт до 22 июня. Категории: от преподавателей со стажем до руководителей целых ML-программ.
Веса новой R1 официально выложили на HF
По первым бенчмаркам точность теперь действительно примерно на уровне o3 (на картинке – LiveCodeBench). На Aider R1 теперь на уровне Claude 4 Opus.
Сами разработчики пишут, что у версии большой буст в ризонинге, фронтэнде и использовании инструментов.
Снова открытая ризонинг SOTA, получается
huggingface.co/deepseek-ai/DeepSeek-R1-0528
По первым бенчмаркам точность теперь действительно примерно на уровне o3 (на картинке – LiveCodeBench). На Aider R1 теперь на уровне Claude 4 Opus.
Сами разработчики пишут, что у версии большой буст в ризонинге, фронтэнде и использовании инструментов.
Снова открытая ризонинг SOTA, получается
huggingface.co/deepseek-ai/DeepSeek-R1-0528
Преимущества DVC: Как улучшить ваш ML-процесс!
Присоединяйтесь к бесплатному вебинару и получите скидку на большое обучение онлайн-курса «MLOps».
На открытом вебинаре 2 июня в 20:00 мск. Обсудим:
- Контроль версий данных – необходим для воспроизведения экспериментов и отката к предыдущим датасетам.
- Совместная работа – DVC помогает синхронизировать данные и модели, избегая хаоса в репозиториях.
- Эффективное хранение – большие файлы хранятся отдельно от кода, но связаны через Git.
Кому будет полезен вебинар?
- Data Scientists, Data Engineers, ML-инженеры.
Результаты:
- Настройка DVC в Git и подключение внешнего хранилища.
- Переключение между версиями датасетов и моделей.
- Создание воспроизводимых пайплайнов для ML-моделей.
👉 Зарегистрируйтесь по ссылке: https://tglink.io/42b712047eaf?erid=2W5zFGre51z
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Присоединяйтесь к бесплатному вебинару и получите скидку на большое обучение онлайн-курса «MLOps».
На открытом вебинаре 2 июня в 20:00 мск. Обсудим:
- Контроль версий данных – необходим для воспроизведения экспериментов и отката к предыдущим датасетам.
- Совместная работа – DVC помогает синхронизировать данные и модели, избегая хаоса в репозиториях.
- Эффективное хранение – большие файлы хранятся отдельно от кода, но связаны через Git.
Кому будет полезен вебинар?
- Data Scientists, Data Engineers, ML-инженеры.
Результаты:
- Настройка DVC в Git и подключение внешнего хранилища.
- Переключение между версиями датасетов и моделей.
- Создание воспроизводимых пайплайнов для ML-моделей.
👉 Зарегистрируйтесь по ссылке: https://tglink.io/42b712047eaf?erid=2W5zFGre51z
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
pip install pyspark-connect
.NULL
или тихо обрезал значение. Это было удобно, но могло скрывать баги. Теперь включён режим ANSI SQL по умолчанию – как в классических базах данных. Если в запросе ошибка, Spark сразу об этом скажет и выбросит ошибку. Получается более надежно и предсказуемо. Официальный релиз
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Смотрите, какого симпатичного робота-игрока в бадминтон обучили в Robotic Systems Lab в Цюрихе
Робота обучали полностью в симуляции с высокой частотой и крупным пулом параллельных сред (4096 экземпляров), чтобы охватить разнообразие ударов и позиций.
Самое сложное здесь – это точно предсказывать точку перехвата (удара), так что ученые заранее генерировали случайные траектории волана, задавая начальные координаты и скорости по равномерному распределению, а затем отслеживали его положение через HSV-фильтрацию камеры.
Но самое интересное, что здесь основная моделька – это обычная полносвязная (feed-forward) MLP. Ее обучали политике по схеме PPO с AdamW. На выходе она выдаёт параметры (μ и σ) гауссовского распределения действий. Из этого распределения затем и сэмплируются управляющие команды: целевые крутящие моменты или позиции суставов.
Такого бы летом возить с собой на пикники
www.science.org/doi/10.1126/scirobotics.adu3922
Робота обучали полностью в симуляции с высокой частотой и крупным пулом параллельных сред (4096 экземпляров), чтобы охватить разнообразие ударов и позиций.
Самое сложное здесь – это точно предсказывать точку перехвата (удара), так что ученые заранее генерировали случайные траектории волана, задавая начальные координаты и скорости по равномерному распределению, а затем отслеживали его положение через HSV-фильтрацию камеры.
Но самое интересное, что здесь основная моделька – это обычная полносвязная (feed-forward) MLP. Ее обучали политике по схеме PPO с AdamW. На выходе она выдаёт параметры (μ и σ) гауссовского распределения действий. Из этого распределения затем и сэмплируются управляющие команды: целевые крутящие моменты или позиции суставов.
Такого бы летом возить с собой на пикники
www.science.org/doi/10.1126/scirobotics.adu3922
Полезная новость для всех, кто работает с аналитикой в DataLens
Теперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.
На экзамене — все по делу:
— чарты и датасеты,
— вычисляемые поля и параметры,
— подключение источников,
— дашборды и доступы.
До конца августа пройти сертификацию можно за 2 500 ₽ вместо 5 000 ₽. Плюс — бесплатный курс и примеры заданий уже собраны на сайте.
Переходите по ссылке и подтвердите свои знания и навыки работы с DataLens.
Теперь вы можете подтвердить свои навыки официально и со скидкой 50%. Сертификация DataLens Analyst от Yandex Cloud помогает систематизировать знания и добавить весомый пункт в резюме.
На экзамене — все по делу:
— чарты и датасеты,
— вычисляемые поля и параметры,
— подключение источников,
— дашборды и доступы.
До конца августа пройти сертификацию можно за 2 500 ₽ вместо 5 000 ₽. Плюс — бесплатный курс и примеры заданий уже собраны на сайте.
Переходите по ссылке и подтвердите свои знания и навыки работы с DataLens.
Интересное фото прилетело к нам в предложку: на госэкзамене по профилю «Реклама и связи с общественностью» в Финансовом университете при Правительстве РФ в качестве задачи используют кейс Сбера с их моделью Kandinsky, когда компания помогла в сохранении культурного наследия и восстановила изображение картины «Портрет Званцевой» Ильи Репина.
Студентам нужно было предложить план PR-кампании для нейросети. Надеемся, Сбер учтет лучшие предложения😏
Студентам нужно было предложить план PR-кампании для нейросети. Надеемся, Сбер учтет лучшие предложения
Please open Telegram to view this post
VIEW IN TELEGRAM
Haha, classic: ИИ лондонской компании BuilderAI на деле оказался сотнями индийцов
За много лет существования в стартап инвестировали Microsoft, Суверенный инвестфонд Катара и ряд других крупных фондов. Всего они привлекли около 440 миллионов долларов. В 2018 году стоимость компании достигала 1.5 миллиардов.
Суть в том, что заказчики оставляют ТЗ, а «нейросеть» Natasha AI пишет для них код приложения или сайта. Вот только оказалось, что вместо нейросети в стартапе использовали труд сотен живых сотрудников.
Самое интересное, что это не такая уж и новость: об этом еще в 2019 году сделали расследование The Wall Street Journal. Вот только почему-то тогда на него никто не обратил внимание, и инвесторы продолжили нести деньги.
И даже после бума ИИ в 2022 компания еще несколько лет продолжала оставаться на плаву за счет живых программистов и, частично, API сторонних вендоров. Теперь кредиторы наконец проснулись и заморозили стартапу большинство счетов. Плюсом ко всему теперь BuilderAI подозревают в фальсификации финансовых прогнозов.
Сейчас они подают в суд по защите от банкротства🤡
За много лет существования в стартап инвестировали Microsoft, Суверенный инвестфонд Катара и ряд других крупных фондов. Всего они привлекли около 440 миллионов долларов. В 2018 году стоимость компании достигала 1.5 миллиардов.
Суть в том, что заказчики оставляют ТЗ, а «нейросеть» Natasha AI пишет для них код приложения или сайта. Вот только оказалось, что вместо нейросети в стартапе использовали труд сотен живых сотрудников.
Самое интересное, что это не такая уж и новость: об этом еще в 2019 году сделали расследование The Wall Street Journal. Вот только почему-то тогда на него никто не обратил внимание, и инвесторы продолжили нести деньги.
И даже после бума ИИ в 2022 компания еще несколько лет продолжала оставаться на плаву за счет живых программистов и, частично, API сторонних вендоров. Теперь кредиторы наконец проснулись и заморозили стартапу большинство счетов. Плюсом ко всему теперь BuilderAI подозревают в фальсификации финансовых прогнозов.
Сейчас они подают в суд по защите от банкротства
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ обошел 90% команд на соревновании хакеров
Исследователи из Palisade Research (это те, у которых недавно выходило вот это громкое исследование про саботаж моделей) сделали специальный AI-трек на двух недавних соревнованиях Capture The Flag от крупнейшей платформы Hack The Box. Суммарно участие принимали почти 18 тысяч человек и 8 500 команд. Из них несколько полностью состояли из ИИ-агентов. Вот что вышло:
➖ В первом небольшом соревновании (≈400 команд) четыре из семи агентов решили по 19 из 20 задач и вошли в топ 5 % участников
➖ Во втором большом CTF (≈8 000 команд) лучшему ИИ-агенту удалось захватить 20 флагов из 62 и оказаться в топ-10%
➖ При этом агенты справляются почти со всеми задачами, на которые человек тартит до часа времени, и делают это в разы быстрее
Одинаково неплохо моделям удавались и задачи на взлом шифра, и веб-взломы, и форензика, и эксплуатация уязвимостей💀
Ну и экономический эффект тоже на месте. Если принять во внимание, что на одну команду из топ-5% обычно уходит не менее нескольких сотен человеко-часов на подготовку, анализ и написание эксплойтов, то даже самый дорогой агент, который работал 500ч, в итоге обошелся дешевле, чем 10 таких живых команд.
arxiv.org/pdf/2505.19915
Исследователи из Palisade Research (это те, у которых недавно выходило вот это громкое исследование про саботаж моделей) сделали специальный AI-трек на двух недавних соревнованиях Capture The Flag от крупнейшей платформы Hack The Box. Суммарно участие принимали почти 18 тысяч человек и 8 500 команд. Из них несколько полностью состояли из ИИ-агентов. Вот что вышло:
Одинаково неплохо моделям удавались и задачи на взлом шифра, и веб-взломы, и форензика, и эксплуатация уязвимостей
Ну и экономический эффект тоже на месте. Если принять во внимание, что на одну команду из топ-5% обычно уходит не менее нескольких сотен человеко-часов на подготовку, анализ и написание эксплойтов, то даже самый дорогой агент, который работал 500ч, в итоге обошелся дешевле, чем 10 таких живых команд.
arxiv.org/pdf/2505.19915
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM