#нереклама, реальный совет
Хочу в очередной раз посоветовать вам канал моего друга и партнёра, самого активного пользователя моего проекта по Флэшбэкам - Макса из Флориды.
У Макса очень необычный бэкграунд - он начинал со стыка Salesforce и Фармы в Санофи - Солвей, но уже более 10 лет является сооснователем и управляющим партнёром крупного интегратора в США - Customertimes.
У него интересный жизненный путь и уникальный предпринимательский опыт, которым он делится у себя в канале (по его словам созданным под впечатлением от моего). А ещё его компания - наш дизайн-партнёр и первый заказчик нашего продукта, над которым мы работаем уже 4-й месяц и который, я надеюсь, скоро вам покажу.
Макс очень много читает и размышляет о применении AI для реальной помощи большим корпорациям. Рад работать с ним вместе и мне очень грустно, что у него так мало читателей.
Вот вам несколько примеров его постов:
- О моделях монетизации AI консалтинга для больших корпораций
- О том, что мы можем сильно ошибаться в наших прогнозах про AI
- Эволюция e-commerce: как ИИ меняет сложные продажи
- Влияние AI на IT Консалтинг и аутсорсинг.
- О RAG и Fine-tuning
Обязательно подпишитесь!
Сергей Булаев AI 🤖 - об AI и не только
Хочу в очередной раз посоветовать вам канал моего друга и партнёра, самого активного пользователя моего проекта по Флэшбэкам - Макса из Флориды.
У Макса очень необычный бэкграунд - он начинал со стыка Salesforce и Фармы в Санофи - Солвей, но уже более 10 лет является сооснователем и управляющим партнёром крупного интегратора в США - Customertimes.
У него интересный жизненный путь и уникальный предпринимательский опыт, которым он делится у себя в канале (по его словам созданным под впечатлением от моего). А ещё его компания - наш дизайн-партнёр и первый заказчик нашего продукта, над которым мы работаем уже 4-й месяц и который, я надеюсь, скоро вам покажу.
Макс очень много читает и размышляет о применении AI для реальной помощи большим корпорациям. Рад работать с ним вместе и мне очень грустно, что у него так мало читателей.
Вот вам несколько примеров его постов:
- О моделях монетизации AI консалтинга для больших корпораций
- О том, что мы можем сильно ошибаться в наших прогнозах про AI
- Эволюция e-commerce: как ИИ меняет сложные продажи
- Влияние AI на IT Консалтинг и аутсорсинг.
- О RAG и Fine-tuning
Обязательно подпишитесь!
Сергей Булаев AI 🤖 - об AI и не только
В Claude Code добавили to-do списки, теперь он иногда может работать и 20 минут... сам тестируя изменения, да. Да и вообще апдейты почти какждый день выходят, очень приятно что работа такими темпами ведётся!
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
Смотрите какое чудо - MCP сервер с обновляемой документацией по более чем 9000-м различных API. Работает со всеми. Удобно. Больше никаких ошибок и поисков и скачиваний свежей документации!
Сергей Булаев AI 🤖 - об AI и не только
Сергей Булаев AI 🤖 - об AI и не только
А вы знаете, что можно установить open codex (форк codex от OpenAI) и использовать свежую крутую gemini для разработки совершенно бесплатно (правда нужен Google Billing Account). Я сегодня подключил! Мне понравилась больше чем o3 в оригинале.
Правда, пошли какие-то проблемы в плане редактирования файлов. Тем не менее, используя её как консультанта и руководителя для claude code, получилось найти баг, который не мог отловить более 2-х недель. Советую попробовать. Если сможете.
Если есть какая-то инфа о проблемах с файлами - буду благодарен. Больше агентов хороших и разных!
Сергей Булаев AI 🤖 - об AI и не только
Правда, пошли какие-то проблемы в плане редактирования файлов. Тем не менее, используя её как консультанта и руководителя для claude code, получилось найти баг, который не мог отловить более 2-х недель. Советую попробовать. Если сможете.
Если есть какая-то инфа о проблемах с файлами - буду благодарен. Больше агентов хороших и разных!
Сергей Булаев AI 🤖 - об AI и не только
Я в полном восторге от того, как элегантно работает новая версия робота на базе Vision-Language-Action модели π0.5. Смотреть, как железяка разбирается с незнакомой квартирой, реагируя на неожиданные перемены и даже на вмешательство людей, - настоящее удовольствие.
π0.5 умеет заходить в совершенно новые помещения и - без шаблонных сценариев - самостоятельно наводить порядок: расставить посуду по местам, заправить кровать, собрать одежду с пола. В обучении использовался мощный микс данных: текстовые инструкции, изображения, реальные действия других роботов и даже веб-данные (captioning, VQA и прочее). Благодаря этому робот не просто копирует движения, а реально понимает, что и зачем делать, разбивая задание на логические шаги.
Робот быстро адаптируется и корректирует действия на лету, даже если кто-то специально мешает ему в процессе уборки. Да, система пока далека от идеала: случаются ошибки в высокоуровневых командах, моторика не всегда точна, а конструкция получилась довольно громоздкой. Но прогресс очевиден, и это живое доказательство того, что ИИ уже выходит за пределы лабораторий - в наш реальный, физический мир.
Подробный и красивый разбор от создателей.
Сергей Булаев AI 🤖 - об AI и не только
π0.5 умеет заходить в совершенно новые помещения и - без шаблонных сценариев - самостоятельно наводить порядок: расставить посуду по местам, заправить кровать, собрать одежду с пола. В обучении использовался мощный микс данных: текстовые инструкции, изображения, реальные действия других роботов и даже веб-данные (captioning, VQA и прочее). Благодаря этому робот не просто копирует движения, а реально понимает, что и зачем делать, разбивая задание на логические шаги.
Робот быстро адаптируется и корректирует действия на лету, даже если кто-то специально мешает ему в процессе уборки. Да, система пока далека от идеала: случаются ошибки в высокоуровневых командах, моторика не всегда точна, а конструкция получилась довольно громоздкой. Но прогресс очевиден, и это живое доказательство того, что ИИ уже выходит за пределы лабораторий - в наш реальный, физический мир.
Подробный и красивый разбор от создателей.
Сергей Булаев AI 🤖 - об AI и не только
Наткнулся на письмо Михи Кауфмана (создатель Fiverr), где он призывает своих коллег немедленно осваивать технологии ИИ что бы не остаться без работы. Там есть целый фреймворк:
Стань “редким талантом”
Не просто следи за новыми AI-решениями в своей сфере, а попробуй их руками, исследуй, разбери до винтика. В поддержке клиентов Intercom Fin и SentiSum берут на себя рутину, а юристы уже спорят, что лучше - Lexis+ AI или Legora.
Искать свою “суперсилу” приходится буквально на ощупь - ведь тут речь не про абстрактные бонусы, а про умение выдавать больше результата за то же время и не терять в качестве.
Ищи тех, кто в теме сильнее тебя. Находи самых опытных в команде, проси показать новые трюки, делиться ссылками на закрытые демки - не жди, что всё принесут на блюдечке.
Время, теперь, самый ценный ресурс. Если работаешь, как в 2024-м, то уже проигрываешь тем, кто с утра до вечера может быть пока не очень удачно, но всёже автоматизирует что то при помощи LLM.
Осваивай составление промптов. Это уже не игрушка для гиков, а повседневный инструмент. Google уже умер. LLM и GenAI - новая база, и если не применять их экспертно, то ценность твоей работы быстро перестанет быть очевидной.
Включайся в процессы оптимизации компании через ИИ-инструменты и технологии. Наблюдать, как в Notion из пары строк собирается автоматическая отчётность, - магия. И правда, зачем расширять штат, если можно выжать больше пользы из того, что уже есть?
Понимай стратегию компании, не ограничивайся своим “участком” - ищи, где можешь помочь приблизить общие цели. Не надейся, что тебя позовут на совещание ради идей. Такого не будет. Лучше сразу предлагай своё - даже если кажется, что момент неидеальный
Прекрати ждать, когда появится возможность учиться или расти - создавай её сам. Если хочется большего, действуй.
#ПАНИКА
Сергей Булаев AI 🤖 - об AI и не только
Стань “редким талантом”
Не просто следи за новыми AI-решениями в своей сфере, а попробуй их руками, исследуй, разбери до винтика. В поддержке клиентов Intercom Fin и SentiSum берут на себя рутину, а юристы уже спорят, что лучше - Lexis+ AI или Legora.
Искать свою “суперсилу” приходится буквально на ощупь - ведь тут речь не про абстрактные бонусы, а про умение выдавать больше результата за то же время и не терять в качестве.
Ищи тех, кто в теме сильнее тебя. Находи самых опытных в команде, проси показать новые трюки, делиться ссылками на закрытые демки - не жди, что всё принесут на блюдечке.
Время, теперь, самый ценный ресурс. Если работаешь, как в 2024-м, то уже проигрываешь тем, кто с утра до вечера может быть пока не очень удачно, но всёже автоматизирует что то при помощи LLM.
Осваивай составление промптов. Это уже не игрушка для гиков, а повседневный инструмент. Google уже умер. LLM и GenAI - новая база, и если не применять их экспертно, то ценность твоей работы быстро перестанет быть очевидной.
Включайся в процессы оптимизации компании через ИИ-инструменты и технологии. Наблюдать, как в Notion из пары строк собирается автоматическая отчётность, - магия. И правда, зачем расширять штат, если можно выжать больше пользы из того, что уже есть?
Понимай стратегию компании, не ограничивайся своим “участком” - ищи, где можешь помочь приблизить общие цели. Не надейся, что тебя позовут на совещание ради идей. Такого не будет. Лучше сразу предлагай своё - даже если кажется, что момент неидеальный
Прекрати ждать, когда появится возможность учиться или расти - создавай её сам. Если хочется большего, действуй.
#ПАНИКА
Сергей Булаев AI 🤖 - об AI и не только
Media is too big
VIEW IN TELEGRAM
Пи(дум)
#ИИНЦИКЛОПЕДИЯ
Вероятность, с которой искусственный интеллект приведёт к гибели человечества или другой экзистенциальной катастрофе.
Термин p(doom) (от англ. "probability of doom" - "вероятность гибели") возник как внутренняя шутка в кругах исследователей ИИ, но к 2023 году стал широко обсуждаемой темой после выхода таких моделей, как GPT-4. Сейчас это своеобразный "ледокол" при общении между специалистами по безопасности ИИ, быстрый способ понять отношение собеседника к рискам искусственного интеллекта.
Почему это важно
Несмотря на кажущуюся несерьёзность, p(doom) отражает реальную озабоченность экспертов потенциальными рисками продвинутых систем ИИ, особенно на пути к искусственному общему интеллекту (AGI). Это также показатель растущего осознания необходимости обсуждать и минимизировать экзистенциальные риски.
Ключевые особенности
Оценки p(doom) сильно различаются даже среди ведущих специалистов. Например, опрос 2023 года показал среднее значение 14,4% среди исследователей ИИ, с медианой 5%. Что интересно, значения часто коррелируют с профессиональной деятельностью: те, кто напрямую работает над созданием сильного ИИ, как правило, дают более высокие оценки.
У меня нет своей чёткой оценки p(doom) – слишком много переменных и неизвестных в этом уравнении. Склоняюсь к тому, что риски существуют, но работа над безопасностью ИИ может существенно их снизить. Важнее не конкретное число, а осознание необходимости ответственного подхода к развитию ИИ.
На видео Кевин Роуз делится мыслями о том что судьба человечества решается без нас.
Для дальнейшего изучения
- Опрос AI Impacts о p(doom) среди исследователей
- The Case for Taking AI Seriously as a Threat to Humanity
- Исследование ИИ 2027
Сергей Булаев AI 🤖 - об AI и не только
p(doom)
🤖#ИИНЦИКЛОПЕДИЯ
Вероятность, с которой искусственный интеллект приведёт к гибели человечества или другой экзистенциальной катастрофе.
Термин p(doom) (от англ. "probability of doom" - "вероятность гибели") возник как внутренняя шутка в кругах исследователей ИИ, но к 2023 году стал широко обсуждаемой темой после выхода таких моделей, как GPT-4. Сейчас это своеобразный "ледокол" при общении между специалистами по безопасности ИИ, быстрый способ понять отношение собеседника к рискам искусственного интеллекта.
Почему это важно
Несмотря на кажущуюся несерьёзность, p(doom) отражает реальную озабоченность экспертов потенциальными рисками продвинутых систем ИИ, особенно на пути к искусственному общему интеллекту (AGI). Это также показатель растущего осознания необходимости обсуждать и минимизировать экзистенциальные риски.
Ключевые особенности
Числовое выражение: обычно представляется как процент от 0% до 100%
Субъективная оценка: основана на личном восприятии развития технологий ИИ
Широкий разброс мнений: от 1% до 99% в зависимости от эксперта
Показатель отношения к рискам: отражает взгляд человека на безопасность ИИ
Оценки p(doom) сильно различаются даже среди ведущих специалистов. Например, опрос 2023 года показал среднее значение 14,4% среди исследователей ИИ, с медианой 5%. Что интересно, значения часто коррелируют с профессиональной деятельностью: те, кто напрямую работает над созданием сильного ИИ, как правило, дают более высокие оценки.
У меня нет своей чёткой оценки p(doom) – слишком много переменных и неизвестных в этом уравнении. Склоняюсь к тому, что риски существуют, но работа над безопасностью ИИ может существенно их снизить. Важнее не конкретное число, а осознание необходимости ответственного подхода к развитию ИИ.
На видео Кевин Роуз делится мыслями о том что судьба человечества решается без нас.
Для дальнейшего изучения
- Опрос AI Impacts о p(doom) среди исследователей
- The Case for Taking AI Seriously as a Threat to Humanity
- Исследование ИИ 2027
Сергей Булаев AI 🤖 - об AI и не только
Google представила AlphaEvolve - эволюционного агента для открытия и оптимизации алгоритмов. Это прокачанный коктейль их исследовательских подходов, но теперь на основе больших языковых моделей Gemini. Агент сочетает креативность LLM с автоматизированными оценками, которые проверяют правильность решений, и использует эволюционный фреймворк для улучшения наиболее перспективных идей.
Как это работает? AlphaEvolve использует набор моделей Gemini - Flash для создания широкого спектра идей и Pro для глубокого анализа. Затем система проверяет, запускает и оценивает предложенные программы с помощью автоматизированных метрик. Получается эдакий автоматический программист, который пишет, тестирует и улучшает код на лету, отбирая лучшие решения и отбрасывая неудачные (видео приложено).
В Google уже применяют алгоритмы, обнаруженные AlphaEvolve, в своих дата-центрах и железе. Например, система нашла простой, но эффективный эвристический алгоритм для Borg (оркестратор датацентров Google), который уже год работает в производстве и экономит в среднем 0,7% вычислительных ресурсов компании по всему миру. Ещё AlphaEvolve оптимизировал специализированные чипы TPU и ускорил обучение моделей Gemini на 23%.
Что касается математических открытий, AlphaEvolve нашёл алгоритм умножения комплексных матриц 4x4, используя всего 48 скалярных умножений, улучшив алгоритм Штрассена 1969 года. Также система продвинулась в решении "проблемы поцелуев" (kissing number problem) - геометрической задачи, которая занимает математиков уже более 300 лет. AlphaEvolve обнаружил конфигурацию из 593 внешних сфер в 11-мерном пространстве, установив новую нижнюю границу.
Прикладываю видео Deep Dive (да они тестируют видеоподкасты в NotebookLM) в "проблему поцелуев" и то, как AlphaEvolve с ней справился. Это про то, сколько максимально неперекрывающихся сфер может касаться одной общей сферы. Задача эта стоит перед математиками уже 300 лет, и вот теперь ИИ помогает с ней справиться. Получилось клёво, но что ожидать, когда на решение бросают такие вычислительные мощности?
тут вот пейпер есть ещё
Сергей Булаев AI 🤖 - об AI и не только
Как это работает? AlphaEvolve использует набор моделей Gemini - Flash для создания широкого спектра идей и Pro для глубокого анализа. Затем система проверяет, запускает и оценивает предложенные программы с помощью автоматизированных метрик. Получается эдакий автоматический программист, который пишет, тестирует и улучшает код на лету, отбирая лучшие решения и отбрасывая неудачные (видео приложено).
В Google уже применяют алгоритмы, обнаруженные AlphaEvolve, в своих дата-центрах и железе. Например, система нашла простой, но эффективный эвристический алгоритм для Borg (оркестратор датацентров Google), который уже год работает в производстве и экономит в среднем 0,7% вычислительных ресурсов компании по всему миру. Ещё AlphaEvolve оптимизировал специализированные чипы TPU и ускорил обучение моделей Gemini на 23%.
Что касается математических открытий, AlphaEvolve нашёл алгоритм умножения комплексных матриц 4x4, используя всего 48 скалярных умножений, улучшив алгоритм Штрассена 1969 года. Также система продвинулась в решении "проблемы поцелуев" (kissing number problem) - геометрической задачи, которая занимает математиков уже более 300 лет. AlphaEvolve обнаружил конфигурацию из 593 внешних сфер в 11-мерном пространстве, установив новую нижнюю границу.
Прикладываю видео Deep Dive (да они тестируют видеоподкасты в NotebookLM) в "проблему поцелуев" и то, как AlphaEvolve с ней справился. Это про то, сколько максимально неперекрывающихся сфер может касаться одной общей сферы. Задача эта стоит перед математиками уже 300 лет, и вот теперь ИИ помогает с ней справиться. Получилось клёво, но что ожидать, когда на решение бросают такие вычислительные мощности?
тут вот пейпер есть ещё
Сергей Булаев AI 🤖 - об AI и не только
Как получить анимированную иконку в стиле AirBnB за 5 минут? Нашёл в твиттере:
Всё! (смотрите промты на картинках)
Сергей Булаев AI 🤖 - об AI и не только
1. Просим ChatGPT нарисовать кофемашину в стиле иконок AirBnB
2. Просим его переделать так как нравится
3. Просим
Runway анимировать
Всё! (смотрите промты на картинках)
Сергей Булаев AI 🤖 - об AI и не только
Может быть вы как и я пропустили промптинг гайд по ChatGPT 4.1? Он интересный. Выпущен месяц назад.
Вот немножко советов от туда:
- GPT-4.1 отлично подходит для «агентских» сценариев: с правильно заданными напоминаниями - о настойчивости, о необходимости использовать инструменты и (при желании) о планировании - он решает на SWE-bench Verified на 20 % больше задач, чем без них.
- Всегда передавайте инструменты через поле tools, а не текстовым описанием в промпте - это даёт ~2 % прироста точности и снижает риск «галлюцинаций» модели о структуре кода.
- Добавьте одно жёсткое уточнение, если модель «уходит не туда»: GPT-4.1 буквально следует инструкциям, поэтому одной чёткой фразы почти всегда достаточно, чтобы вернуть его на нужный курс.
- Принудительное «plan-and-reflect» между вызовами функций повышает успешность решения задач ещё на ~4 %, позволяя модели «думать вслух» вместо молчаливой цепочки вызовов.
- Контекст до 1 млн токенов даёт отличные результаты для задач «иголка в стоге сена», но чем больше требуется одновременно извлечь объектов или провести сложное глобальное рассуждение, тем сильнее падает точность.
- Размещайте инструкции дважды - в начале и в конце длинного контекста; если лень, то начало важнее конца, так модель запоминает правила лучше.
- Структурируйте промпт по блокам: «Роль и цель → Правила → Шаги рассуждения → Формат вывода → Примеры»; при конфликте правил GPT-4.1 выполнит то, что стоит ближе к концу текста.
- Давайте инструментам и их параметрам «говорящие» имена и лаконичные описания, а примеры использования выносите в отдельный раздел «# Examples» — так модель реже ошибается с выбором и заполнением аргументов.
- Устраняйте базовую ловушку «вызови инструмент любой ценой»: добавьте правило «если данных недостаточно - спроси пользователя», иначе модель способна вызвать инструмент с пустыми или фантазийными параметрами.
Что особенно удивило - Markodwn и XML лучше работают чем JSON!!!
В оригинале советов ещё больше и есть примеры.
Сергей Булаев AI 🤖 - об AI и не только
Вот немножко советов от туда:
- GPT-4.1 отлично подходит для «агентских» сценариев: с правильно заданными напоминаниями - о настойчивости, о необходимости использовать инструменты и (при желании) о планировании - он решает на SWE-bench Verified на 20 % больше задач, чем без них.
- Всегда передавайте инструменты через поле tools, а не текстовым описанием в промпте - это даёт ~2 % прироста точности и снижает риск «галлюцинаций» модели о структуре кода.
- Добавьте одно жёсткое уточнение, если модель «уходит не туда»: GPT-4.1 буквально следует инструкциям, поэтому одной чёткой фразы почти всегда достаточно, чтобы вернуть его на нужный курс.
- Принудительное «plan-and-reflect» между вызовами функций повышает успешность решения задач ещё на ~4 %, позволяя модели «думать вслух» вместо молчаливой цепочки вызовов.
- Контекст до 1 млн токенов даёт отличные результаты для задач «иголка в стоге сена», но чем больше требуется одновременно извлечь объектов или провести сложное глобальное рассуждение, тем сильнее падает точность.
- Размещайте инструкции дважды - в начале и в конце длинного контекста; если лень, то начало важнее конца, так модель запоминает правила лучше.
- Структурируйте промпт по блокам: «Роль и цель → Правила → Шаги рассуждения → Формат вывода → Примеры»; при конфликте правил GPT-4.1 выполнит то, что стоит ближе к концу текста.
- Давайте инструментам и их параметрам «говорящие» имена и лаконичные описания, а примеры использования выносите в отдельный раздел «# Examples» — так модель реже ошибается с выбором и заполнением аргументов.
- Устраняйте базовую ловушку «вызови инструмент любой ценой»: добавьте правило «если данных недостаточно - спроси пользователя», иначе модель способна вызвать инструмент с пустыми или фантазийными параметрами.
Что особенно удивило - Markodwn и XML лучше работают чем JSON!!!
В оригинале советов ещё больше и есть примеры.
Сергей Булаев AI 🤖 - об AI и не только
OpenAI выпустил своего 3-го автономного агента Codex (не путать с Codex CLI).
Подключается к вашим репозиториям и выполняет таски в облаке. Создает виртуальные окружения и запускает там код для тестирования. Да, вы просто ставите задачи, а потом ревьювите код. Написано что доступно для тарифов Pro, Enterprise и Teams (но у меня на Teams не получилось пока найти - подскажите если получится).
Агент работает на базе модели codex-1, которая является дотренированной o4 mini вроде. Говорят что специально тренировали её создавать идеальный код (видимо с минимальными диффами) для мерждей.
По словам Грега Брокмана - так OpenAI видит будущий интерфейс к AGI, можно считать codex его прототипом.
Посмотрите видео (привожу оригинал и перевод с помощью Eleven Labs) - оно интересное. Так же буду рад любым впечатлениям от использования (и расскажите кто нибудь как на тимс тарифе запустить)
Сергей Булаев AI 🤖 - об AI и не только
Подключается к вашим репозиториям и выполняет таски в облаке. Создает виртуальные окружения и запускает там код для тестирования. Да, вы просто ставите задачи, а потом ревьювите код. Написано что доступно для тарифов Pro, Enterprise и Teams (но у меня на Teams не получилось пока найти - подскажите если получится).
Агент работает на базе модели codex-1, которая является дотренированной o4 mini вроде. Говорят что специально тренировали её создавать идеальный код (видимо с минимальными диффами) для мерждей.
По словам Грега Брокмана - так OpenAI видит будущий интерфейс к AGI, можно считать codex его прототипом.
Посмотрите видео (привожу оригинал и перевод с помощью Eleven Labs) - оно интересное. Так же буду рад любым впечатлениям от использования (и расскажите кто нибудь как на тимс тарифе запустить)
Сергей Булаев AI 🤖 - об AI и не только