robofuture 93 Telegram Group

1.88K views05:41

🚧 AI агент с MCP открыл шлагбаум у меня во дворе! 😱

>> видео на youtube <<

Давно хотел показать свои эксперименты с MCP и агентами, и в итоге записал небольшой обзор, в котором:

- Рассказываю, зачем нужен MCP
- Показываю агентов, которые умеют пользоваться MCP (и реально пытаются открыть шлагбаум у меня во вдоре)
- Запускаю такого агента на гигачате, подключу к нему разные MCP-сервера
- Показываю код такого агента на LangChain.
- Показываю процесс создания собственного MCP сервера
- Залезаю внутрь протокола и показываю, какие запросы уходят в LLM

Ссылки:
- Оригинальный клиент mcp-client-cli (не работает с GigaChat)
- Версия консольного агента с поддержкой GigaChat (требует установки из исходников)
- Repl-агент с MCP на LangGraph
- Пример из кукбука с агентом и сервером на LangChain (GitHub, GitVerse)

🔥15👏2👍1

3.63K viewsedited 05:41

RoboFuture

🔎 Наверняка вы уже слышали, что новые модели OpenAI – O3 и o4-mini – невероятно хороши в работе с изображениями, особенно в определении местоположения, где было сделано фото. Уже третий день провожу тесты и поражаюсь результатам. Вот простой пример:

Где сделано фото?

Ответ модели:


Это Москва — на реке Москве (Карамышевский участок судоходного канала). На снимке — один из новых московских электропаромов «Сетунь», которые ходят по городской речной линии, поэтому кадр сделан именно здесь.

Модель (или правильнее говорить — агент?) может работать до 30 минут, используя различные подходы (всё это видел лично, часть приложил к посту):

- «Разглядывает» отдельные части изображения
- Пытается извлечь GPS-теги из метаданных и другие метаданные (их я заранее удалил)
- Применяет различные фильтры для повышения четкости и чтения надписей
- Использует зеркальное отражение изображения, чтобы обнаружить подсказки в отражениях или на вывесках изнутри помещений
- Накладывает координационную сетку (типа миллиметровки) на части фото
- Использует информацию из истории и любых прошлых диалогов

Ну и, конечно, просто рассуждает и активно ведёт поиск в интернете с сотнями (!) запросов — это уже база.

Настоящий OSINT одним нажатием кнопки 🔥

Если бы пару недель назад меня спросили, как AGI будет решать подобную задачу, я бы описал именно такое поведение. Так что в этой области мы уже наблюдаем наступление настоящего AGI. Да, оно наступает неравномерно и временами может вести себя нелепо, но кажется, мы сейчас видим как именно выглядит предсказанный в статье The AI Revolution момент, когда поезд AI проходит станцию с надписью "Human-Level Intelligence" без остановок.

Кстати, других остановок у него тоже как будто не предвидится 🤔

👍15🤯7

1.47K views11:06

RoboFuture

🍲 Мы с коллегами периодически пробуем разные решения типа Operator, когда модель управляет компьютером или браузером.

В какой-то момент придумали идею — «борщиный тест». Сможет ли модель заказать в интернет-магазине набор продуктов для приготовления борща? 🥘

Всё, что видели до этого, получалось очень смешным: например, борщ из сублимированного мяса и томатного порошка. Такие борщи получались не просто невкусными, но и вообще несъедобными 🦨.

И вот, наконец, новая версия оператора от OpenAI тест прошла (да, я тот человек, который платит $200 за подписку Pro)! Она собрала мне корзину в «Купере», и это вполне можно есть! Нужен новый бенчмарк 🔥.

Из важных инсайтов:

* Решена большая проблема — авторизация. Operator не имеет доступа к вашим данным, но сеансы сохраняются между запросами, так что достаточно один раз авторизоваться на каком-то сайте, и дальше модель будет ходить под вашей учёткой.
* Явно есть отдельный агент-watchdog. В какой-то момент он приостановил работу оператора и обратился ко мне с предупреждением, что я просил заказать продукты в «Пятёрочке», а он заказывает в «Купере», и это ошибка. Можно было разрешить продолжать или заблокировать доступ к этому сайту.

А вот состав корзины для борща по-Сэмальтмановски:

* Суповой набор говяжий (1 кг) — 1
* Капуста белокочанная (≈2 кг) — 1
* Свёкла (500 г, очищенная) — 1
* Морковь (≈0,5 кг) — 1
* Картофель (≈2 кг) — 1
* Лук репчатый (≈1 кг) — 1
* Томатная паста «Помидорка» 270 г — 1
* Чеснок (≈100 г) — 1
* Сметана 15 % 300 г — 1
* Укроп сушёный 10 г — 1
* Петрушка сушёная 7 г — 1
* Лавровый лист Kotanyi 5 г — 1
* Перец чёрный молотый 20 г — 1
* Соль «Адыгейская» 450 г — 1
* Сахар-песок 1 кг — 1
* Масло подсолнечное 500 мл — 1
* Уксус столовый 9 % 1 л — 1
--- Итого 1605 рублей

🔥20👏4👍3🤯1🌚1

956 viewsedited 12:11

737 views16:05

Сегодня в разработке AI-агентов чётко выделяются два подхода:

🔸 Специализированные агенты (вертикальные) — предназначены для решения конкретных задач, таких как бронирование билетов, генерация отчётов или поддержка клиентов. Особенно востребованы в корпоративном секторе.

🔸 Универсальные агенты (горизонтальные) — многофункциональные помощники для ежедневного использования в самых разных задачах. Примеры универсальных агентов — Cursor (для программистов) и, в определённом смысле, ChatGPT.

Когда у меня возникает новая задача, я сначала обращаюсь именно к универсальному агенту вроде ChatGPT или Курсора. Если они не могут решить её сразу из-за нехватки инструментов, я предпочитаю добавить им эти инструменты (например, через MCP), а не искать специализированного агента.

Скорее всего, в ближайшем будущем мы увидим следующую картину: у каждого человека будет один основной универсальный агент (или даже два — рабочий и личный), который станет своеобразным «интерфейсом к миру». Люди предпочтут универсального агента, несмотря на то, что специализированные агенты зачастую более эффективны в отдельных задачах. Почему?

🤝 Между человеком и универсальным агентом формируются устойчивые отношения: агент накапливает знания о пользователе (KV-память, история диалогов через RAG), а пользователь привыкает именно к этому агенту и осваивает его специфику.

🛠️ Также важным преимуществом универсального агента становится возможность его настройки и расширения с помощью дополнительных инструментов (MCP-тулы позволяют делать это почти мгновенно!)

Специализированные агенты, конечно, никуда не денутся (особенно в корпоративном секторе), но основным их пользователем станет универсальный агент, действующий по поручению человека.

📖 В завершение очень рекомендую небольшой отрывок из книги Николая Горькавого «Возвращение Астровитянки» (см. сообщение выше). Если вы занимаетесь созданием AI-агентов или много думаете об AGI и ещё не читали её — рекомендую обратить внимание. Книга состоит из коротких рассказов, многие из которых посвящены взаимодействию сильного ИИ с людьми. По сути, это инструкция по разработке, которой я следую последние 15 лет (книга вышла в 2010 году, но автор уже тогда описал поведение персонального и универсального AI-ассистента).

Кстати, 30 мая буду рассказывать про это на Data Fest в Москве в Сбере. Приходите!

👍21👏1🐳1🌚1

1.5K viewsedited 16:05

RoboFuture

WhitePaper.pdf

41.1 MB

👍5🔥2👏1

1.47K views14:35

RoboFuture

Коллеги из Сбера выпустили мощный и очень красивый white paper о том, как правильно делать AI-агентов. Я тоже руку немного приложил и попал в список авторов.

Разработка и применение мультиагентных систем в корпоративной среде

Если вы работаете в русскоязычном сегменте, и в вашей компании пока не делают AI агентов, то, возможно, это хороший старт!

Из моего в этом документе - примеры кода. Нужно было сделать агента, который генерирует таблички Lean Canvas. Смотрите, какой красавец получился 😂

Позитив:
- Сбер дружит с opensource и 🦜🔗 LangGraph SDK.
- Удалось показать несколько важных принципов:
-- handoff
-- human in the loop
-- structured output
-- сам графовый подход к разработке LLM-приложений
-- замер качества агента с помощью arize phoenix

Полный исходный код примера в виде Jupyter ноутбука можно посмотреть на github и gitverse. Его можно изучать и отдельно от документа, как самостоятельный пример.

🔥18👍15🤯2👏1

1.98K viewsedited 14:35

1.29K views10:14

Выше писал про публикацию (по факту книгу), по разработке агентов, для которой я делал примеры кода на LangGraph.

Теперь появилось видео на 20 минут, где я этот пример разбираю, показываю его работу и объясняю, как можно его запустить самому. Также немного говорю про оценку качества таких агентов (evaluation) с помощью arize phoenix.

Еще выложил это видео на youtube.

👍17🔥7👏2🐳1

1.5K viewsedited 10:14

Продолжаю продвигать идею универсального агента как основного средства взаимодействия человека с миром (он же LLM OS в терминах Andrej Karpathy). На этот раз выступил на GigaConf с очень насыщеным докладом в котором нашлось место и теории и парктике:

02:00 - Концепция универсального агента
04:20 - Что такое MCP
05:35 - MCP и универсальные агенты
08:40 - GitHub Copilot как универсальный агент
13:13 - GigaChain - набор инструментов и кукбук для LLM-разработчика
14:50 - Разбор кода MCP сервера и клиента
20:20 - Think tool от Anthropic + MCP + GigaChat = ♥️
26:14 - Замеры качества работы агентов с помощью Arize Phoenix

Коллеги говорят, что получилось очень динамично и познавательно.

Для тех, кому удобнее смотреть на youtube.

👍12🔥7👏2🤯1

1.4K viewsedited 12:12

RoboFuture

Хочу поделиться важным инсайтом про AI-агентов, который недавно сформулировал для себя.

Ситуация: У вас есть Excel-таблица со списком офисов ваших партнеров. Вам нужно выделить цветом те офисы, которые не смогут созвониться друг с другом в свое рабочее время из-за разницы в часовых поясах. Каким должен быть AI-агент, способный решить такую задачу? — Универсальным!

📌 Основная мысль: Синергия функций — ключевой фактор развития универсальных агентов.

Синергический эффект — ситуация, при которой совместное действие различных элементов дает результат, превосходящий простую сумму их отдельных эффектов.

Когда мы даём агентам инструменты самых разных типов, между ними возникает неожиданная синергия. На первый взгляд, агенту, работающему с таблицами, не нужен доступ к картографическим сервисам. Но именно в нестандартных ситуациях такие сервисы внезапно оказываются очень полезными.

Раньше в IT такого не было: у программ всегда был чётко заданный функционал, а вся магия комбинации их возможностей ложилась на человека. Но теперь и универсальный AI-агент может демонстрировать схожее поведение – проявление новых способностей, не предусмотренных заранее. И чем больше разнообразных инструментов мы предоставим агенту, тем чаще этот эффект будет проявляться.

Это похоже на то, что называют "широкий технический кругозор". К примеру, еще в институте я научился обрабатывать аудио. Казалось бы, этот навык никак не связан с моей основной работой программистом, но потом он несколько раз оказался ключевым при работе с AI-телефонией.

То же самое будет происходить и с универсальными агентами: чем больше инструментов у них в распоряжении, тем более неожиданными и эффективными будут их решения. Горизонтальные (универсальные) агенты начнут доминировать над вертикальными (узкоспециализированными).

🚀 Самые важные тулы агентов на сегодня:
- Самостоятельный поиск информации
- Работа с документами пользователя (Agentic RAG)
- REPL: способность решать промежуточные задачи через выполнение кода (калькулятор на максималках)
- TODO: способность планировать свои действия и двигаться по чек-листу
- Reasoning tool: возможность вести рассуждения при необходимости

💡 Следующий шаг:
- Работа с виртуальным компьютером (Operator)

Узкоспециализированные навыки тоже периодически оказываются полезными — умение делать презентации, анализировать изображения и даже создавать подкасты. Важно развивать возможности использовать большое количество разнообразных инструментов и со стороны разработчиков AI агентов (Scaffolding) и со стороны разработчиков самих LLM-моделей.

🔥16👍13🐳6

1.37K viewsedited 17:08

RoboFuture

Вышла новая модель от OpenAI! Главная фишка - теперь модель умеет вести внутренние монологи (невидимые для пользователя), работая над задачей, прежде чем дать окончательный ответ. Что ж, на этот случай у меня была задачка с которой не могла справиться ни…

Почти год назад я тестировал O1 на задаче дешифровки надписи на футболке. Тогда это была первая модель, которая справилась, но с ошибками, не с первого раза и потратив очень много времени.

Сегодня закинул эту задачу в Grok 4. Он решил ее за несколько секунд с первой попытки (правда, тоже с небольшими ошибками)

Да, по одной задаче нельзя делать никаких выводов, но это даёт возможность ощутить скорость прогресса LLM

👍14🐳1

1.07K viewsedited 05:55

RoboFuture

👍10🌚4

1.29K views05:55

RoboFuture

Увидел у Яндекс.Такси новый функционал и сразу понял, что это идеально подходит к универсальным AI-агентам.

Сейчас некоторые агенты учатся делать звонки в тех случаях, когда не могут решить задачу через API (например, google duplex может позвонить голосом и забронировать столик в ресторане). А через такой сервис они смогут взаимодействовать с реальным миром, манипулировать им.

Кстати, похожее уже было в "черном зеркале" (s03e03), там через такой сервис обществом манипулировали хакеры.

🔥12👍4🐳3😁2

1.34K viewsedited 09:31

RoboFuture

Коллега пишет про решение, которое мы с командой запустили на Гигачате - AI хедж фонд. Можно оценить как торгуют AI агенты на разных моделях. В среднем агенты оказываются в плюсе, но сегодня я стал свидетелм того, как AI-агент Уорена Баффета попал в ловушку невозвратных потерь и просадил 100 млн долларов, зашортив Теслу в течении июля 2025.

(Всё это никак не является инвестиционной рекомендацией 🙅‍♂️)

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4👏1🐳1

998 viewsedited 11:11

2025/12/07 20:37:13
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>