sergiobulaev Telegram Group

Сергей Булаев AI 🤖

#нереклама, реальный совет

Хочу в очередной раз посоветовать вам канал моего друга и партнёра, самого активного пользователя моего проекта по Флэшбэкам - Макса из Флориды.

У Макса очень необычный бэкграунд - он начинал со стыка Salesforce и Фармы в Санофи - Солвей, но уже более 10 лет является сооснователем и управляющим партнёром крупного интегратора в США - Customertimes.

У него интересный жизненный путь и уникальный предпринимательский опыт, которым он делится у себя в канале (по его словам созданным под впечатлением от моего). А ещё его компания - наш дизайн-партнёр и первый заказчик нашего продукта, над которым мы работаем уже 4-й месяц и который, я надеюсь, скоро вам покажу.

Макс очень много читает и размышляет о применении AI для реальной помощи большим корпорациям. Рад работать с ним вместе и мне очень грустно, что у него так мало читателей.

Вот вам несколько примеров его постов:
- О моделях монетизации AI консалтинга для больших корпораций
- О том, что мы можем сильно ошибаться в наших прогнозах про AI
- Эволюция e-commerce: как ИИ меняет сложные продажи
- Влияние AI на IT Консалтинг и аутсорсинг.
- О RAG и Fine-tuning

Обязательно подпишитесь!

Сергей Булаев AI 🤖 - об AI и не только

4.7K viewsedited 11:22

Сергей Булаев AI 🤖

В Claude Code добавили to-do списки, теперь он иногда может работать и 20 минут... сам тестируя изменения, да. Да и вообще апдейты почти какждый день выходят, очень приятно что работа такими темпами ведётся!

Сергей Булаев AI 🤖 - об AI и не только

5.3K views11:23

Сергей Булаев AI 🤖

Смотрите какое чудо - MCP сервер с обновляемой документацией по более чем 9000-м различных API. Работает со всеми. Удобно. Больше никаких ошибок и поисков и скачиваний свежей документации!

Сергей Булаев AI 🤖 - об AI и не только

4.6K views08:34

Сергей Булаев AI 🤖

А вы знаете, что можно установить open codex (форк codex от OpenAI) и использовать свежую крутую gemini для разработки совершенно бесплатно (правда нужен Google Billing Account). Я сегодня подключил! Мне понравилась больше чем o3 в оригинале.

Правда, пошли какие-то проблемы в плане редактирования файлов. Тем не менее, используя её как консультанта и руководителя для claude code, получилось найти баг, который не мог отловить более 2-х недель. Советую попробовать. Если сможете.

Если есть какая-то инфа о проблемах с файлами - буду благодарен. Больше агентов хороших и разных!

Сергей Булаев AI 🤖 - об AI и не только

3.7K views09:51

This media is not supported in your browser

VIEW IN TELEGRAM

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

Я в полном восторге от того, как элегантно работает новая версия робота на базе Vision-Language-Action модели π0.5. Смотреть, как железяка разбирается с незнакомой квартирой, реагируя на неожиданные перемены и даже на вмешательство людей, - настоящее удовольствие.

π0.5 умеет заходить в совершенно новые помещения и - без шаблонных сценариев - самостоятельно наводить порядок: расставить посуду по местам, заправить кровать, собрать одежду с пола. В обучении использовался мощный микс данных: текстовые инструкции, изображения, реальные действия других роботов и даже веб-данные (captioning, VQA и прочее). Благодаря этому робот не просто копирует движения, а реально понимает, что и зачем делать, разбивая задание на логические шаги.

Робот быстро адаптируется и корректирует действия на лету, даже если кто-то специально мешает ему в процессе уборки. Да, система пока далека от идеала: случаются ошибки в высокоуровневых командах, моторика не всегда точна, а конструкция получилась довольно громоздкой. Но прогресс очевиден, и это живое доказательство того, что ИИ уже выходит за пределы лабораторий - в наш реальный, физический мир.

Подробный и красивый разбор от создателей.

Сергей Булаев AI 🤖 - об AI и не только

7.2K views11:23

Сергей Булаев AI 🤖

Наткнулся на письмо Михи Кауфмана (создатель Fiverr), где он призывает своих коллег немедленно осваивать технологии ИИ что бы не остаться без работы. Там есть целый фреймворк:

Стань “редким талантом”

Не просто следи за новыми AI-решениями в своей сфере, а попробуй их руками, исследуй, разбери до винтика. В поддержке клиентов Intercom Fin и SentiSum берут на себя рутину, а юристы уже спорят, что лучше - Lexis+ AI или Legora.

Искать свою “суперсилу” приходится буквально на ощупь - ведь тут речь не про абстрактные бонусы, а про умение выдавать больше результата за то же время и не терять в качестве.

Ищи тех, кто в теме сильнее тебя. Находи самых опытных в команде, проси показать новые трюки, делиться ссылками на закрытые демки - не жди, что всё принесут на блюдечке.

Время, теперь, самый ценный ресурс. Если работаешь, как в 2024-м, то уже проигрываешь тем, кто с утра до вечера может быть пока не очень удачно, но всёже автоматизирует что то при помощи LLM.

Осваивай составление промптов. Это уже не игрушка для гиков, а повседневный инструмент. Google уже умер. LLM и GenAI - новая база, и если не применять их экспертно, то ценность твоей работы быстро перестанет быть очевидной.

Включайся в процессы оптимизации компании через ИИ-инструменты и технологии. Наблюдать, как в Notion из пары строк собирается автоматическая отчётность, - магия. И правда, зачем расширять штат, если можно выжать больше пользы из того, что уже есть?

Понимай стратегию компании, не ограничивайся своим “участком” - ищи, где можешь помочь приблизить общие цели. Не надейся, что тебя позовут на совещание ради идей. Такого не будет. Лучше сразу предлагай своё - даже если кажется, что момент неидеальный

Прекрати ждать, когда появится возможность учиться или расти - создавай её сам. Если хочется большего, действуй.

#ПАНИКА
Сергей Булаев AI 🤖 - об AI и не только

2.9K views06:16

Пи(дум) p(doom) 🤖
#ИИНЦИКЛОПЕДИЯ

Вероятность, с которой искусственный интеллект приведёт к гибели человечества или другой экзистенциальной катастрофе.

Термин p(doom) (от англ. "probability of doom" - "вероятность гибели") возник как внутренняя шутка в кругах исследователей ИИ, но к 2023 году стал широко обсуждаемой темой после выхода таких моделей, как GPT-4. Сейчас это своеобразный "ледокол" при общении между специалистами по безопасности ИИ, быстрый способ понять отношение собеседника к рискам искусственного интеллекта.

Почему это важно
Несмотря на кажущуюся несерьёзность, p(doom) отражает реальную озабоченность экспертов потенциальными рисками продвинутых систем ИИ, особенно на пути к искусственному общему интеллекту (AGI). Это также показатель растущего осознания необходимости обсуждать и минимизировать экзистенциальные риски.
Ключевые особенности

Числовое выражение: обычно представляется как процент от 0% до 100%
Субъективная оценка: основана на личном восприятии развития технологий ИИ
Широкий разброс мнений: от 1% до 99% в зависимости от эксперта
Показатель отношения к рискам: отражает взгляд человека на безопасность ИИ

Оценки p(doom) сильно различаются даже среди ведущих специалистов. Например, опрос 2023 года показал среднее значение 14,4% среди исследователей ИИ, с медианой 5%. Что интересно, значения часто коррелируют с профессиональной деятельностью: те, кто напрямую работает над созданием сильного ИИ, как правило, дают более высокие оценки.

У меня нет своей чёткой оценки p(doom) – слишком много переменных и неизвестных в этом уравнении. Склоняюсь к тому, что риски существуют, но работа над безопасностью ИИ может существенно их снизить. Важнее не конкретное число, а осознание необходимости ответственного подхода к развитию ИИ.

На видео Кевин Роуз делится мыслями о том что судьба человечества решается без нас.

Для дальнейшего изучения
- Опрос AI Impacts о p(doom) среди исследователей
- The Case for Taking AI Seriously as a Threat to Humanity
- Исследование ИИ 2027

Сергей Булаев AI 🤖 - об AI и не только

2.6K viewsedited 11:54

Сергей Булаев AI 🤖

0:42

This media is not supported in your browser

VIEW IN TELEGRAM

Оптимусы жгут всё чётче и чётче.

Сергей Булаев AI 🤖 - об AI и не только

6.2K views05:52

Сергей Булаев AI 🤖

0:33

This media is not supported in your browser

This media is not supported in your browser

VIEW IN TELEGRAM

Google представила AlphaEvolve - эволюционного агента для открытия и оптимизации алгоритмов. Это прокачанный коктейль их исследовательских подходов, но теперь на основе больших языковых моделей Gemini. Агент сочетает креативность LLM с автоматизированными оценками, которые проверяют правильность решений, и использует эволюционный фреймворк для улучшения наиболее перспективных идей.

Как это работает? AlphaEvolve использует набор моделей Gemini - Flash для создания широкого спектра идей и Pro для глубокого анализа. Затем система проверяет, запускает и оценивает предложенные программы с помощью автоматизированных метрик. Получается эдакий автоматический программист, который пишет, тестирует и улучшает код на лету, отбирая лучшие решения и отбрасывая неудачные (видео приложено).

В Google уже применяют алгоритмы, обнаруженные AlphaEvolve, в своих дата-центрах и железе. Например, система нашла простой, но эффективный эвристический алгоритм для Borg (оркестратор датацентров Google), который уже год работает в производстве и экономит в среднем 0,7% вычислительных ресурсов компании по всему миру. Ещё AlphaEvolve оптимизировал специализированные чипы TPU и ускорил обучение моделей Gemini на 23%.

Что касается математических открытий, AlphaEvolve нашёл алгоритм умножения комплексных матриц 4x4, используя всего 48 скалярных умножений, улучшив алгоритм Штрассена 1969 года. Также система продвинулась в решении "проблемы поцелуев" (kissing number problem) - геометрической задачи, которая занимает математиков уже более 300 лет. AlphaEvolve обнаружил конфигурацию из 593 внешних сфер в 11-мерном пространстве, установив новую нижнюю границу.

Прикладываю видео Deep Dive (да они тестируют видеоподкасты в NotebookLM) в "проблему поцелуев" и то, как AlphaEvolve с ней справился. Это про то, сколько максимально неперекрывающихся сфер может касаться одной общей сферы. Задача эта стоит перед математиками уже 300 лет, и вот теперь ИИ помогает с ней справиться. Получилось клёво, но что ожидать, когда на решение бросают такие вычислительные мощности?

тут вот пейпер есть ещё

Сергей Булаев AI 🤖 - об AI и не только

2.6K views06:42

Сергей Булаев AI 🤖

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Как получить анимированную иконку в стиле AirBnB за 5 минут? Нашёл в твиттере:

1. Просим ChatGPT нарисовать кофемашину в стиле иконок AirBnB
2. Просим его переделать так как нравится
3. Просим

Runway анимировать

Всё! (смотрите промты на картинках)

Сергей Булаев AI 🤖 - об AI и не только

2.7K views10:15

Сергей Булаев AI 🤖

Может быть вы как и я пропустили промптинг гайд по ChatGPT 4.1? Он интересный. Выпущен месяц назад.

Вот немножко советов от туда:

- GPT-4.1 отлично подходит для «агентских» сценариев: с правильно заданными напоминаниями - о настойчивости, о необходимости использовать инструменты и (при желании) о планировании - он решает на SWE-bench Verified на 20 % больше задач, чем без них.

- Всегда передавайте инструменты через поле tools, а не текстовым описанием в промпте - это даёт ~2 % прироста точности и снижает риск «галлюцинаций» модели о структуре кода.

- Добавьте одно жёсткое уточнение, если модель «уходит не туда»: GPT-4.1 буквально следует инструкциям, поэтому одной чёткой фразы почти всегда достаточно, чтобы вернуть его на нужный курс.

- Принудительное «plan-and-reflect» между вызовами функций повышает успешность решения задач ещё на ~4 %, позволяя модели «думать вслух» вместо молчаливой цепочки вызовов.

- Контекст до 1 млн токенов даёт отличные результаты для задач «иголка в стоге сена», но чем больше требуется одновременно извлечь объектов или провести сложное глобальное рассуждение, тем сильнее падает точность.

- Размещайте инструкции дважды - в начале и в конце длинного контекста; если лень, то начало важнее конца, так модель запоминает правила лучше.

- Структурируйте промпт по блокам: «Роль и цель → Правила → Шаги рассуждения → Формат вывода → Примеры»; при конфликте правил GPT-4.1 выполнит то, что стоит ближе к концу текста.

- Давайте инструментам и их параметрам «говорящие» имена и лаконичные описания, а примеры использования выносите в отдельный раздел «# Examples» — так модель реже ошибается с выбором и заполнением аргументов.

- Устраняйте базовую ловушку «вызови инструмент любой ценой»: добавьте правило «если данных недостаточно - спроси пользователя», иначе модель способна вызвать инструмент с пустыми или фантазийными параметрами.

Что особенно удивило - Markodwn и XML лучше работают чем JSON!!!

В оригинале советов ещё больше и есть примеры.

Сергей Булаев AI 🤖 - об AI и не только

2.7K views11:33

OpenAI выпустил своего 3-го автономного агента Codex (не путать с Codex CLI).

Подключается к вашим репозиториям и выполняет таски в облаке. Создает виртуальные окружения и запускает там код для тестирования. Да, вы просто ставите задачи, а потом ревьювите код. Написано что доступно для тарифов Pro, Enterprise и Teams (но у меня на Teams не получилось пока найти - подскажите если получится).

Агент работает на базе модели codex-1, которая является дотренированной o4 mini вроде. Говорят что специально тренировали её создавать идеальный код (видимо с минимальными диффами) для мерждей.

По словам Грега Брокмана - так OpenAI видит будущий интерфейс к AGI, можно считать codex его прототипом.

Посмотрите видео (привожу оригинал и перевод с помощью Eleven Labs) - оно интересное. Так же буду рад любым впечатлениям от использования (и расскажите кто нибудь как на тимс тарифе запустить)

Сергей Булаев AI 🤖 - об AI и не только

2.6K views05:30

2025/05/23 15:57:10

❌Photos not found?❌Click here to update cache.

HTML Embed Code:

<iframe width="100%" src="https://www.group-telegram.com/buyppe/webview?embed=1" title="Channel Webview" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>