Поискал сравнение актуальных цен на популярные LLM, чтобы не делать свой скрипт, и почти везде цены не всегда правильные (особенно часто отличаются у Gemini или нет моделей типа DeepSeek, которая по ощущениям уже сравнима с лучшими).
1️⃣ В итоге нашел на docsbot.ai, вроде бы цены правильные.
2️⃣ А на openrouter.ai ещё любопытней — можно посмотреть на каких платформах раздается API модели и их средние показатели типа задержки и те же цены.
Там же видно, где и какие модели сейчас доступны бесплатно (по API).
1️⃣ В итоге нашел на docsbot.ai, вроде бы цены правильные.
2️⃣ А на openrouter.ai ещё любопытней — можно посмотреть на каких платформах раздается API модели и их средние показатели типа задержки и те же цены.
Там же видно, где и какие модели сейчас доступны бесплатно (по API).
5👍27✍7❤2 2
🔺 DeepSeek v3
Поигрался с DeepSeek v3, который вышел недавно. Соскоки с русского на китайский, которые были раньше (типа "力ный" вместо "сильный", что само по себе любопытное явление), прекратились.
🔸 Есть web-поиск и режим DeepThink, аналог o1. Работает похуже, чем ChatGPT, те же буквы может посчитать неправильно, но в целом рассуждения работают.
🔸 Цена дешевая, если получится поплнить баланс, — $0.27 и $1.10 за 1M токенов на вход и выход. У GPT-4o — $2.5 и $10.
👉 Я тут в отпуске освоил AliPay и смог оплатить, делюсь ключом от API поиграться (пока там есть деньги):sk-2d6cfbbd72d74b52bba11ea5336cc2f6
🔸 Но есть и просто обычный чат и он бесплатен, попробуйте обязательно. Работать стала почти на уровне лучших моделей.
👉 DeepSeek-чат | HF | Статья
Поигрался с DeepSeek v3, который вышел недавно. Соскоки с русского на китайский, которые были раньше (типа "力ный" вместо "сильный", что само по себе любопытное явление), прекратились.
🔸 Есть web-поиск и режим DeepThink, аналог o1. Работает похуже, чем ChatGPT, те же буквы может посчитать неправильно, но в целом рассуждения работают.
🔸 Цена дешевая, если получится поплнить баланс, — $0.27 и $1.10 за 1M токенов на вход и выход. У GPT-4o — $2.5 и $10.
👉 Я тут в отпуске освоил AliPay и смог оплатить, делюсь ключом от API поиграться (пока там есть деньги):
🔸 Но есть и просто обычный чат и он бесплатен, попробуйте обязательно. Работать стала почти на уровне лучших моделей.
👉 DeepSeek-чат | HF | Статья
🔥32❤8⚡8👍8
This media is not supported in your browser
VIEW IN TELEGRAM
Поигрался с kling'ом
Пора бы уже сделать кому-то удобный сервис по генерации множества сцен с консистентными персонажами и связыванием их в один ролик. По отдельности вроде понятно как, но вот прям лень возиться.
Пора бы уже сделать кому-то удобный сервис по генерации множества сцен с консистентными персонажами и связыванием их в один ролик. По отдельности вроде понятно как, но вот прям лень возиться.
🔥32😁7💯4👍3 3⚡2🆒2
ждём смс
В ChatGPT добавили отложенные задачи. Уведомление с результатом приходит в виде пуша или письма.
🔸 Можно попросить гуглить что-нибудь на нужную тему раз в день и подготавливать текст (например, задачку по программированию или задание на английском для чтения) и отправлять на почту.
🔸 С почты можно настроить дальнейшую интеграцию (помню, раньше пользовался штуками типа IFTTT). Отправлять к себе в телеграм, постить в соцсеть или скидывать в pocketbook cloud на электронную читалку.
//Upd. На почту все-таки не весь ответ приходит, а ссылка в интерфейс, хотя отработка происходит в положенное время.
В ChatGPT добавили отложенные задачи. Уведомление с результатом приходит в виде пуша или письма.
🔸 Можно попросить гуглить что-нибудь на нужную тему раз в день и подготавливать текст (например, задачку по программированию или задание на английском для чтения) и отправлять на почту.
🔸 С почты можно настроить дальнейшую интеграцию (помню, раньше пользовался штуками типа IFTTT). Отправлять к себе в телеграм, постить в соцсеть или скидывать в pocketbook cloud на электронную читалку.
//Upd. На почту все-таки не весь ответ приходит, а ссылка в интерфейс, хотя отработка происходит в положенное время.
😁39👍20🗿5 5❤2🤔1
🔺 Что будет, если замедлить скорость света?
Наткнулся на любопытный игровой проект от MIT. Если ходить и собирать шарики в этой игре, то все сильнее замедляется скорость света и начинает проявляться куча интересных эффектов.
🔸 Эффект Доплера. Движение в сторону источника света вызывает синее смещение, а в противоположную сторону — красное.
🔸 Сдвиг спектра. Инфракрасный и ультрафиолетовый свет могут сдвигаться в видимую область спектра.
🔸 Аберрации. Объекты, находящиеся в направлении движения, кажутся ярче, из-за концентрации света в этом направлении.
🔸 Замедление времени. Движущиеся NPC и другие объекты замедляются в зависимости от вашей скорости.
🔸 Искажение пространства. Окружающее пространство начинает сжиматься в направлении движения. Авторы пишут, что это проявление преобразований Лоренца.
В сумме все это дает не очень комфортную для глаз картинку, так что в реальности предлагаю скорость света не расшатывать.
👉 Попробовать можно тут — A Slower Speed of Light
Наткнулся на любопытный игровой проект от MIT. Если ходить и собирать шарики в этой игре, то все сильнее замедляется скорость света и начинает проявляться куча интересных эффектов.
🔸 Эффект Доплера. Движение в сторону источника света вызывает синее смещение, а в противоположную сторону — красное.
🔸 Сдвиг спектра. Инфракрасный и ультрафиолетовый свет могут сдвигаться в видимую область спектра.
🔸 Аберрации. Объекты, находящиеся в направлении движения, кажутся ярче, из-за концентрации света в этом направлении.
🔸 Замедление времени. Движущиеся NPC и другие объекты замедляются в зависимости от вашей скорости.
🔸 Искажение пространства. Окружающее пространство начинает сжиматься в направлении движения. Авторы пишут, что это проявление преобразований Лоренца.
В сумме все это дает не очень комфортную для глаз картинку, так что в реальности предлагаю скорость света не расшатывать.
👉 Попробовать можно тут — A Slower Speed of Light
🔥27👍12❤8 4🤔1
На together.ai появилась бесплатная Llama 3.3 70B по API.
🔸 На Free tier'е у них 60 запросов в минуту/60k токенов. Если добавить карту, то будет 600/180k.
🔸 Работает без VPN и мобильных, совместима с OpenAI клиентом. Можете встроить в свой пет-проектик.
https://api.together.ai/models/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free
🔸 На Free tier'е у них 60 запросов в минуту/60k токенов. Если добавить карту, то будет 600/180k.
🔸 Работает без VPN и мобильных, совместима с OpenAI клиентом. Можете встроить в свой пет-проектик.
https://api.together.ai/models/meta-llama/Llama-3.3-70B-Instruct-Turbo-Free
import os
import openai
os.environ["TOGETHER_API_KEY"] = "your_free_key"
client = openai.OpenAI(
api_key=os.environ.get("TOGETHER_API_KEY"),
base_url="https://api.together.xyz/v1",
)
response = client.chat.completions.create(
model= "meta-llama/Llama-3.3-70B-Instruct-Turbo-Free"
#"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo",
messages=[
{"role": "system", "content": "Ты — ассистент Шерлока Холмса."},
{"role": "user", "content": "Кто убил садовника?"},
]
)
#Интригующая загадка, действительно! К сожалению, я не располагаю конкретными деталями о деле, касающемся убийства садовника. Однако я могу предложить некоторые общие наблюдения и идеи, которые могут помочь нам начать расследование.
#Во-первых, давайте рассмотрим место преступления...
👍22🔥11❤4🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
Когда по-быстрому встроил ИИ в проект
😁78❤🔥8🔥8💯3
🔺 DeepSeek-R1 и DeepSeek-R1-Zero
Как было сказано ранее, модели от китайских исследователей выложены в открытый доступ и показывают результаты на уровне o1.
🔸 Например, в отчете пишут, что модель пробивает рейтинг в 2000 на Codeforces (хорошие соревнования по программированию с довольно сложными задачками), это лучше 96% участников.
🔸 Локальный запуск: запустить эти модели будет непросто из-за их размера, поэтому авторы сделали ряд моделей поменьше, используя дистилляцию. От 1.5B до 70B.
🔸 Попробовать: полная R1 доступна на официальном сайте в режиме DeepThink.
🔸 Приложение: мобильное приложение работает бесплатно, ссылки есть тут.
🔸 Мини-обзор: https://hfday.ru/u/2501.12948.html
Как было сказано ранее, модели от китайских исследователей выложены в открытый доступ и показывают результаты на уровне o1.
🔸 Например, в отчете пишут, что модель пробивает рейтинг в 2000 на Codeforces (хорошие соревнования по программированию с довольно сложными задачками), это лучше 96% участников.
🔸 Локальный запуск: запустить эти модели будет непросто из-за их размера, поэтому авторы сделали ряд моделей поменьше, используя дистилляцию. От 1.5B до 70B.
🔸 Попробовать: полная R1 доступна на официальном сайте в режиме DeepThink.
🔸 Приложение: мобильное приложение работает бесплатно, ссылки есть тут.
🔸 Мини-обзор: https://hfday.ru/u/2501.12948.html
👍29🔥17⚡2✍1
#работаиздома
Размышляю над проблемами ризонинга и инвестициями в AI пока человек сидит за компьютером.
Размышляю над проблемами ризонинга и инвестициями в AI пока человек сидит за компьютером.
❤45😁32 3🤗2🥰1🆒1
🔺 Делаем свою Perplexity
Perplexity — это поисковая система, которая обрабатывает выдачу популярными моделями (в Pro версии их можно выбирать, это GPT-4o/o1, Claude и пара других) с удобным интерфейсом и списком источников.
Есть разные режимы, типа поиска видео или режим Writing, когда веб-поиск отключен и можно работать как с обычной языковой моделью.
Компания привлекла полмиллиарда долларов инвестиций в декабре и на днях запустила новый API.
🔸 Называется новый сервис Sonar API, есть две версии — sonar и sonar-pro. Стоит $1/$1 за 1M input/output токенов у базовой модели и $3/$15 у Pro.
🔸 Сами поисковые запросы, которые происходят внутри, тоже стоят денег, $5 за 1000 запросов. Базовая модель делает только 1 такой поиск, Pro может делать несколько.
🔸 В зависимости от расходов есть разные уровни использования (tiers), на них появляются дополнительные фичи, типа фильтров по доменам для поиска.
Так вот, поигрался немного с этим API (можете попробовать через playground), работает достаточно стабильно, находит данные по актуальным событиям и людям.
Ссылки на источники тоже выдает. То есть, чтобы самому сделать подобный сервис, по сути хватит одного такого API (и денег).
В целом так можно сделать и по частям — найти поисковое API типа Bing в Azure или DuckDuckGo, попарсить найденные сайты, подложить в контекст и сходить в следующее API. Не так сложно, но будет больше работы по поддержке, а тут один вызов — и готово.
По-моему, search API у OpenAI и других сервисов пока нет (может, вы где-то видели подобное API?).
Upd. Спасибо за ссылки!
Perplexity — это поисковая система, которая обрабатывает выдачу популярными моделями (в Pro версии их можно выбирать, это GPT-4o/o1, Claude и пара других) с удобным интерфейсом и списком источников.
Есть разные режимы, типа поиска видео или режим Writing, когда веб-поиск отключен и можно работать как с обычной языковой моделью.
Компания привлекла полмиллиарда долларов инвестиций в декабре и на днях запустила новый API.
🔸 Называется новый сервис Sonar API, есть две версии — sonar и sonar-pro. Стоит $1/$1 за 1M input/output токенов у базовой модели и $3/$15 у Pro.
🔸 Сами поисковые запросы, которые происходят внутри, тоже стоят денег, $5 за 1000 запросов. Базовая модель делает только 1 такой поиск, Pro может делать несколько.
🔸 В зависимости от расходов есть разные уровни использования (tiers), на них появляются дополнительные фичи, типа фильтров по доменам для поиска.
Так вот, поигрался немного с этим API (можете попробовать через playground), работает достаточно стабильно, находит данные по актуальным событиям и людям.
Ссылки на источники тоже выдает. То есть, чтобы самому сделать подобный сервис, по сути хватит одного такого API (и денег).
В целом так можно сделать и по частям — найти поисковое API типа Bing в Azure или DuckDuckGo, попарсить найденные сайты, подложить в контекст и сходить в следующее API. Не так сложно, но будет больше работы по поддержке, а тут один вызов — и готово.
По-моему, search API у OpenAI и других сервисов пока нет (может, вы где-то видели подобное API?).
Upd. Спасибо за ссылки!
❤19👍11👀1 1
The Illustrated DeepSeek-R1
Заметка от Аламмара про устройство DeepSeek-R1
https://newsletter.languagemodels.co/p/the-illustrated-deepseek-r1
Заметка от Аламмара про устройство DeepSeek-R1
https://newsletter.languagemodels.co/p/the-illustrated-deepseek-r1
newsletter.languagemodels.co
The Illustrated DeepSeek-R1
A recipe for reasoning LLMs
🔥16👍7💯2 2⚡1
Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
А вот скажите, есть ли среди вас кто-то, кто рубит в low-level-ML? Руками под CUDA писать, оптимизировать потоки данных, кэши, вот это всё? Если да, то черкните мне в личку (@oulenspiegel), возможно у меня для вас будет прямо хорошее предложение
🔥11😁6👍2
Так, очередной подгон от китайских коллег. Пойдемте посмотрим.
https://chat.qwenlm.ai/
Upd. Инференс дорогой, в 3-4 раза дороже gpt-4o.
https://chat.qwenlm.ai/
Upd. Инференс дорогой, в 3-4 раза дороже gpt-4o.
👍5👀4🔥2