Telegram Group Search
Это будет пост с инвайтами в Sora. Каждый, кто регистрируется, получает код. Он действует на четыре регистрации — кидайте его в комментарии. Так каждый сможет зарегистрироваться. Заходим только из США.

Я начну. Залетайте в наш чат @prompt_chat
🔥1564🙏3🤗2
Forwarded from Tips AI | IT & AI
Бенчмарков для LLM сейчас очень много. От математики и кодинга до эмпатии модели.

Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.

Среди всего, что есть, я чаще смотрю именно их:

LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.

EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.

Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.

LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.

SWE-Bench — для программистов.

Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.

OpenRouter — удобно смотреть, что популярно и что используют.

Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.

@tips_ai #tools
1🔥22👍1191👏1🤔1🙏1
Нужно было в одной презентации разделы обозначить стилизованными буквами. Сначала немного помучился с Nano Banana, а потом с удивлением для себя обнаружил, что у Гугла и под эту задачку есть решение — https://labs.google/gentype.

Хотя мне кажется, там «Банана» и трудится под капотом. Но зато удобно и понятно, правда, русский язык в промптах не понимает и кириллицу не генерирует.
👍188🔥6👏32
This media is not supported in your browser
VIEW IN TELEGRAM
Ну что, браузер Comet от Perplexity теперь доступен без инвайта! Хотя подписка на Pro-аккаунт нужна. Но мы же знаем, что это не проблема: можно взять тут
🔥2812👏7👍5🙏1🤗1
Я тут подсчитал, что несколько тысяч человек получили свои инвайты в Sora благодаря нашему чату - @prompt_chat - так что залетайте, там очень крутое комьюнити собралось
2👍4312🔥9😍3💯2🦄22❤‍🔥1
Мы как-то незаметно перешагнули планку в 20 000 подписчиков «Силиконового мешка», и сегодня к нам присоединилось много людей, а личку я, видимо, буду разбирать все выходные.

Но я вижу ваши вопросы о том, с чего начать, как погрузиться в мир искусственного интеллекта и понять, что тут происходит.

Я подготовил небольшой список с полезными ссылками на мои посты и других авторов. Так что, если у вас свободные выходные, — есть что почитать:

Про ИИ-Агентов
1) С чего начать?
2) Как научиться делать ИИ-Агентов
3) Какой ИИ-Агент заменит тебя в офисе
4) Автоматизация или ИИ-Агент

Про n8n
1) Как освоить n8n с нуля
2) Как искать, что автоматизировать
3) Тысячи воркфлоу для n8n и как ими пользоваться
4) Какие n8n-проекты чаще всего делают
5) Комьюнити-ноды в n8n

Промпты
1) Сборник промптов и кейсов для генерации изображений
2) Сборник системных промптов (там есть что заимствовать для себя)
3) Гайд, как составлять промпты для LLM
4) Сотни промптов для разных профессий от OpenAI

- Очень полезно про маркетинг. Мы же хотим все это продавать? -

А вот и база про ИИ-Агентов и Автоматизацию (англ)
1) Как создавать воркфлоу для ИИ-Агентов (очень рекомендую)
2) Как создать ИИ-Агента (тут прям база)
3) Как делать файнтюнинг (Fine-Tuning) на ваших данных
4) Бесплатные курсы Стэнфорда по ИИ

Ну и таблички!
100 ИИ-инструментов для транскрипции аудио и видео https://docs.google.com/spreadsheets/d/1m_ZcdepVAEFR-CkCFaVeGEsOzDv4i_qkG2ueZciTdUA/edit?usp=sharing

Таблица с AI/ML инструментами и сервисами https://docs.google.com/spreadsheets/d/15Q6aw8ylsL-_S_Ok05mrq-F14DVNbakFjSwqGCxyKGA/edit?usp=sharing

Ну и Perplexity берём тут
1275🔥53👏14🙏5👍2
СДВГ - это Синдром Дефицита Вау, голубь! Этот короткий пост (чтобы не расфокусировались) для вас, собраться по диагнозу.

Вы же помните Сэма? Он в нашем чате @prompt_chat частенько отвечает на вопросы про то как приручить LLM’ки и освоить ИИ-инструменты. Так вот. У него есть книга про (и для) СДВГ’шников, называется - «СДВГ-ОХОТНИК: НЕ ЛЕНТЯЙ, НЕ БОЛТУН, НЕ ХУЛИГАН» - и он попросил меня об этом рассказать. Такие дела.
133🤣16👍11🙏3🔥2😍1🦄1😘1
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI сегодня покажет убийцу n8n. Но это не точно (мой юрист просил всегда эту фразу добавлять). А вообще, судя по твиттерским сливам, Сэм проведет онлайн-трансляцию, на которой презентует решение для создания воркфлоу ИИ-агентов с MCP и другими плюшками. Не, ну, год ИИ-агентов, а что вы хотели?
6👍82🔥265👎5👏4🦄33🤯2💯2
Помню, как в конце 2023 года все кинулись проходить курсы по промптингу, а уже в 2024-м промпт-инженеринг похоронили под лозунгом, что языковые модели потому так и называются, что они понимают обычный язык и все эти сложности им не нужны. Но промпты как работали, так и работают до сих пор, а люди как недооценивали их важность, так и... ну, вы поняли.

С другой стороны, я не советую проходить все эти курсы по промптингу, так как в свободном доступе информация и актуальнее, и качественнее. Вот, например, мой любимый сайт по промптингу — www.promptingguide.ai. Рекомендую начать своё погружение именно с него.

Ну и 10 советов для новичков и не только:
1. Примеры работают лучше инструкций. Модели лучше распознают паттерны, чем следуют правилам (за исключением рассуждающих LLM вроде o1).

2. Системные промпты — фундамент. 90% проблем возникают из-за слабых системных промптов. Отточите их, прежде чем браться за пользовательские промпты. Вот тут куча системных промптов для изучения.

3. Ваша экспертиза в предметной области намного важнее навыков создания промптов. Например, когда инструкцию для медицинского ИИ-агента пишут врачи, результаты сильно лучше. Профильные эксперты оперируют такими нюансами, о которых не догадываются промпт-инженеры.

4. «Цепочка рассуждений» (Chain-of-thought) — не всегда лучший выбор. Сложные цепочки рассуждений часто работают хуже, чем прямые инструкции. Начинайте с простого, усложняйте, только когда улучшаются метрики.

5. Контролируйте версии промптов, как код. Помню, как изменение всего одного слова в промпте сломало воркфлоу ИИ-агента. Заставил себя делать git commit для промптов и отслеживать метрики производительности. Короче к работе над промптами надо относиться, как к продакшн-коду.

6. Используйте ИИ для написания промптов для ИИ. Звучит наивно, но это работает: Claude пишет промпты для Claude лучше, чем я. Пусть модели самим оптимизируют инструкции для себя.

7. Многие сильно недооценивают настройку температуры. Все помешаны на промптах. Тем временем, иногда изменение температуры с 0.7 до 0.3 хорошо решает проблемы со стабильностью ответов.

8. Тестовое покрытие важнее качества промпта. Часто тестируя разные сценарии обнаруживал, что мой «идеальный» промпт сыпался в 30% случаев на больших объемах. Теперь использую автоматизированную оценку с валидацией человеком (human-in-the-loop).

9. Не забывайте оптимизировать инструкцию под конкретную модель. Промпт для GPT-4o не всегда подходит к Claude или Llama. У каждой модели свои особенности. То, от чего GPT выдает качественный ответ, заставляет Claude галлюцинировать.

10. Делайте защиту от инъекций в промпт сразу. Каждый промпт в продакшене нуждается в тестировании на инъекции. Один хитрый пользовательский запрос способен сломать всю вашу систему.
1154🔥25👍87🤔2💯2🙏1🤣1🤝1🤗1
Закрываем вчерашний DevDay 2025 у OpenAI - собрал все в одну табличку. В хорошем качестве закину в @prompt_chat
👏3311🔥6🙏3👍2🤓2🤗21
This media is not supported in your browser
VIEW IN TELEGRAM
Я, конечно, думал, что Google презентует Gemini 3, но, видимо, ещё не время, поэтому ловите — Gemini 2.5 Computer Use.

Это агент для управления компьютером браузером и судя по бенчмаркам, где он опережает Claude Sonnet 4.5 и OpenAI Computer-Using Agent model, он хорошо понимает интерфейсы сайтов и даже справляется с авторизацией.

Можете попробовать его в демо или через API.
15👍9🔥64
А может, соберемся пообщаться про ИИ?

Есть две локации и две даты, где можно встретиться в ближайшее время. Давайте проголосуем, и, если наберем хоть какое-то количество желающих, сделаем чатики и там всё обсудим:
Anonymous Poll
60%
Батуми, 12 Октября
56%
Стамбул, 18 Октября
11🤩3🤗3👏211🔥1💯1🙉1
Так, не удивляйтесь, это будет пост с промптом по ссылке (так как сюда не влезло). Несколько лет назад мы с товарищем делали бота-психолога. Меня вообще туда подтянули не из-за того, что я в ИИ ковыряюсь, а из-за моего психологического образования и диагноза (СДВГ) — товарищ сказал, что будет на мне этого бота тестировать.

По сути, это был обычный ТГ-бот с инструкцией «действовать как психолог». В общем, проект не взлетел, так как таких ботов клепали тысячами.

Но у меня сохранился раздел в Obsidian, где я стал собирать прикольные «психологические» промпты, чтобы потом их дорабатывать или разбирать на запчасти.

И сегодня я хочу вам показать один из самых интересных промптов в коллекции. Можете закинуть его в любую модель: ChatGPT, Gemini, Claude. Тестировал везде — работает.

Как он работает:
- Используется сократовский диалог, поэтому общение воспринимается как сессия с наставником.
- Задача — раскрыть, что скрывается за вашими страхами и целями.
- И получить план «трансформации».

Короче, это немного переработанная сессия с КПТ-психологом, поэтому будет полезна СДВГшникам, тем, кто немного запутался, ну и всем, кто любит тестить промпты. Ну и не забывайте: если у вас психологические проблемы — обращайтесь к специалистам, а не к LLM.

https://teletype.in/@prompt_design/Psychological_prompt
1🔥5112👏1291❤‍🔥1🤗1
Как же я рад, что в последнем обновлении приложения (iOS) Perplexity, они дали возможность выбирать модель для генерации изображения. Раньше можно было только в web-версии это делать. Теперь заходим: Settings → Image Generation Model - и выбираем.
🔥346👏5
Сегодня рынок ИИ похож на золотую лихорадку. С одной стороны, API от гигантов вроде OpenAI и Google дают лёгкость для старта. Есть идея? Подключайся и запускай. Но есть и обратная сторона: эта же лёгкость доступна всем, превращая рынок в «красный океан», где конкуренция становится бешеной.

Недавно я наткнулся на интересную аналитическую статью о том, как создавать ИИ-продукты, когда у тебя нет миллиардов долларов для конкуренции с OpenAI и другими гигантами.

Она начинается с описания предыдущих технологических волнн (персональный компьютер, интернет, сотовая связь) и мысли, что они уничтожали старых игроков и давали шанс стартапам - так появились Microsoft, Google и Uber. Но сегодня ИИ - это «ускоритель» для существующих компаний, а не «уничтожитель». Например, Adobe, которая, казалось, упустила облачную революцию, быстро добавила мощные ИИ-функции в свои продукты и обогнала потенциальные стартапы.

В таких условиях просто быть «обёрткой» для чужой LLM — путь в никуда. Но как же быть нам, тем, кто ищет возможности или запускает стартапы? Как выжить?

Существуют три подхода:
- Создавать свои модели: непомерно дорого и доступно лишь единицам.
- Просто создать чат-бота: легко копируется и не даёт реальной конкурентной ценности.
- Правильный путь: комбинировать готовые ИИ-модели с вашими уникальными активами.

Эффективные ИИ-продукты строятся из трёх «кубиков LEGO», которые вместе создают ваше преимущество: [Готовые ИИ-возможности] + [Ваши уникальные данные] + [Функциональность вашего продукта].

Магия - в их взаимодействии. Ваши данные дают ИИ необходимый контекст. ИИ генерирует результат, который решает проблему клиента. А ваш продукт оркестрирует этот процесс.

Например:
- MIRO использует принцип «холст — это промпт». Они берут стандартные ИИ-модели, но «скармливают» им уникальный контекст всей доски и с помощью своего функционала превращают заметки в кликабельный прототип за секунды.
- Granola ворвалась на переполненный рынок ИИ-помощников для встреч. Их секрет в глубоком понимании клиента: они выяснили, что многие пользователи не хотят делегировать ведение заметок, а хотят делать это сами с помощью ИИ. Они создали продукт для усиления, а не замены, используя только готовые API.

Да и в целом, нужно начинать не с технологий, а с клиента. Задайте себе три вопроса:
1) Какую неудовлетворённую проблему клиента нужно решить?
2) Какие ИИ-возможности могут решить её по-новому?
3) Какие уникальные данные могут усилить это решение?


Тогда и станет понятно в какую сторону смотреть, что ресечить и какие MVP пилить.

И, как мне кажется, всё это идет к тому, что подобные компании, «наблюдая», как их пользователи взаимодействуют с их сервисами, соберут кучу данных, чтобы в будущем обучать ИИ-агентов выполнять всё то же самое в автономном режиме.

Уже в ближайшее время появятся компании и специалисты, которые будут заниматься только одним - обучением агентов реальным навыкам. Один раз обучить ИИ-агента, как делать определенную работу (быть админом тг-канала, маркетологом, редактором, директором, консультантом), а дальше эту работу будут делать агенты - дешевле, быстрее, качественнее и без ограничений. На эту тему недавно вышла крутая публикация - почитайте.
229🔥12💯6👍5👏2🦄21🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
1211👍2🔥2❤‍🔥1🤣1😘1
С вопросом, чем Perplexity отличается от других моделей, мы, как мне кажется, разобрались. Короткий ответ: «это другое».

И я бы не стал сравнивать этот сервис с ChatGPT или Gemini, потому что это не модель, а продвинутая оболочка (wrapper), внутри которой можно использовать множество разных LLM. При этом у них есть и собственная модель — Sonar, но она заточена под поиск информации в сети.

Однако вопрос, какие модели для каких задач лучше всего использовать внутри Perplexity, остаётся открытым.

Поэтому я подготовил для вас таблицу, где постарался описать, какие модели и для каких задач использую я. Уверен, многим будет интересно, а кто-то не согласится со мной и расскажет о своём опыте в нашем чате - @prompt_chat

На сегодняшний день я считаю Perplexity самым простым входом в мир искусственного интеллекта, доступным каждому, особенно при цене в несколько долларов за Pro-аккаунт.

А уже когда вы поймёте, что именно вам нужно и чего не хватает, можно будет определиться с выбором основной модели.
🔥45267💯4🙏21😭1
2025/10/11 06:43:10
Back to Top
HTML Embed Code: