Telegram Group Search
Интересная диаграмма из свежего репорта SemiAnalysis

Показывает насколько дешевле свежие TPU v7 Ironwood для Google по сравнению с GB300. При сопоставимых MFU использование TPU для тренировки стоит в два раза меньше. Даже с неплохой наценкой от гугла, использование TPU для тренировки всё равно может оказаться заметно дешевле для сторонних компаний вроде Anthropic.

@ai_newz
170👍36🔥17😍1
Нейродайджест за неделю (#96)

LLM
- Claude Opus 4.5 — Anthropic выпустили новую SOTA-модель для кодинга, которая обходит всех конкурентов. При этом цена за токен упала в 3 раза, что для Anthropic нехарактерно.
- DeepResearch для шоппинга — OpenAI сделали тюн GPT-5 mini, который интерактивно ищет товары, а пользователь направляет поиск в реальном времени.

Генеративные модели
- FLUX.2 — Black Forest Labs выпустили конкурента Nano Banana Pro для консистентного редактирования изображений. Веса Dev-версии уже на 🤗.
- Загадочный Whisper Thunder — На Artificial Analysis Leaderboard появился новый SOTA-видеогенератор.

Прочее
- Как генерить презентации? — Большой гайд по AI-инструментам. Топ-3: Gamma, Manus и Genspark. Бонусом — пара креативных идей.
- Интервью с Ильёй Суцкевером — Эпоха "масштабируем всё предобучением" заканчивается, а будущее — за AI-учениками, которые дообучаются в реальном мире.
- Техрепорт FLUX.1 Kontext — Разбор того, как модель работает с референсами.
- TPU v7 дешевле GB300 — Диаграмма от SemiAnalysis показывает, что для Google тренировка на новых TPU в два раза дешевле, чем на чипах Nvidia.

> Читать дайджест #95

#дайджест
@ai_newz
👍4432🔥144😁1
DeepSeek V3.2 и V3.2 Speciale

На бенчах показывает крайне сильный перформанс, сравнимый с GPT-5 High. Модель использует DeepSeek Sparse Attention, заметно более эффективно работающий с длинным контекстом.

V3.2 Speciale, версия с повышенным использованием компьюта, местами обходит Gemini 3 Pro Preview, но использует при этом заметно больше токенов (но учитывая разницу в цене, Speciale всё равно в разы дешевле). К тому же Speciale достигает той же золотой медали на IMO что и DeepSeek Math V2, но не останавливается на этом и выдаёт перформанс на уровне золотой медали ещё и на международной олимпиаде по информатике (IOI).

Модели уже доступны в чате и API. В API DeepSeek теперь доступен тулюз для ризонера. Цена на модели не изменилась и остаётся $0.28/$0.42 за миллион токенов. DeepSeek V3.2 Speciale будет временно доступна в API без тулюза до 15 декабря.

Веса V3.2
Веса V3.2 Speciale
Техрепорт

@ai_newz
2🔥14435👍19😁4😱4💯1
Media is too big
VIEW IN TELEGRAM
Runway Gen-4.5

Whisper Thunder на арене оказался новой моделькой от Runway, она побила Veo 3 на 20 ELO. Доступ раскатают на всех подписчиков в течении пары дней. Как вам качество?

Блогпост

@ai_newz
115👍59🔥227❤‍🔥4
Mistral Large 3 — у нас есть DeepSeek дома

Архитектурно модель DeepSeek V3 с немного другим конфигом. Из преимуществ перед линейкой V3 — Mistral 3 мультимодальная, что редкость для открытых моделей такого размера (самое близкое что вспоминается — Qwen 3 VL). Ризонер варианта нет, базовая модель тягается на бенчах с Kimi K2 и DeepSeek V3.1.

Вместе с Large 3 компания выпустили новые Ministral — 14B, 8B и 3B. 14B лучше Qwen схожего размера, а вот 8B и 3B уступают Qwen 3 8B и 4B. Эти модели тоже умеют в мультимодальность и у них есть ризонинг варианты. Все четыре модели уже доступны по лицензии Apache 2.0.

Веса Large 3

Веса Ministral 3
Блогпост

@ai_newz
186👍53🔥16😁10🫡3
эйай ньюз
Mistral Large 3 — у нас есть DeepSeek дома Архитектурно модель DeepSeek V3 с немного другим конфигом. Из преимуществ перед линейкой V3 — Mistral 3 мультимодальная, что редкость для открытых моделей такого размера (самое близкое что вспоминается — Qwen 3 VL).…
Вообще релиз довольно грустный и далеко не СОТА даже в опенсорсе. Что-то на круассановой диете модельки не очень выходят.

Китайцы пока люто рулят в опенсорсе.

@ai_newz
💯147💔40😁2412👍8🦄4😱3🔥1
500+ промптов для Nano Banana Pro

Я не очень люблю копировать промпты из библиотек, но может кому-то они будут полезны хотя бы для вдохновения. Это набор промптов для Nano Banana Pro, юзкейсов которой можно придумать очень много.

Nano Banana Pro более разговорная, чем стандартный Flux, SD или Midjourney - то есть лучше промптить ее полноценными предложениями, как и видно из примеров.

> Сайт с промптами, там же сейчас можно и бесплатно погенерить с ней.

@ai_newz
🔥85👍3524😍1🫡1🦄1
Opus 4.5 теперь доступен в Claude Code пользователям Pro подписки

Раньше она была доступна лишь по Max подписке за $100/$200, а теперь она доступна и за $20. Лимиты выжирает быстрее, так что для всех задач использовать его не стоит. Поменять модель можно командой /model в Claude Code. Советую попробовать, это лучшая модель для кода на данный момент.

@ai_newz
3112👍50🔥24🦄8😱3
Прилетел в Стамбул, и сегодня я на финале Yandex Cup. Нет, я не сейчас не участвую, просто чилю и смотрю.

В треке по алгоритмам я сам участвовал когда-то 100 лет назад. А теперь тут есть еще трек и по ML, бекенду и фронтенду.

Если кто-то хочет подойти познакомиться - пишите. Кроме того мы сейчас в нашу Швейцарскую ресерч лабу GenPeach AI хайрим в том числе сильных бекенд и фронтенд инженеров (middle+). Так что пингуйте в лс.

@ai_newz
11104❤‍🔥29🔥17😁13🫡5👍4🤯3🦄3🤩1💔1
This media is not supported in your browser
VIEW IN TELEGRAM
Kling's Omni Launch Week: разбираем все анонсы

Kling провели свою «Omni Launch Week», в ходе которой ежедневно выкатывали по фиче. Закос под OpenAI перед рождеством в прошлом году очевиден, но здесь релиз был довольно затянутым, тк фишек не так уж и много.

Гвоздём программы стала, конечно же, новая Kling Video O1.

Это их ответ Nano Banana Pro, но для видео. O1 — это видеомодель, которая работает с разными входами: текст, картинки (до 7 шт), видео (до 10 сек) и Elements.

Главная фишка — редактирование видео такое же свободное как в Runway Aleph. По бенчмаркам — полный развал конкурентов, но есть нюанс. Заявленный винрейт в 240% над VEO 3.1 (то есть Kling побеждает в 4 раза чаще) заставляет усомниться в методологии. Даже по черипикам видно, что модель может немного артефачить в деталях и демонстрирует не на столько хорошую физику по сравнению с Veo. Но вот редактирует она действительно мощно, а отставание в качестве не такое уж и большое. Тем более, что модель поддерживает до 10 секунд видео на вход, что в два раза больше, чем у Runway, и на пару секунд больше, чем у Veo. Хотя сравнивать с Veo не совсем честно, так как у него значительно более ограниченный функционал.

Стоимость: 12.8 кредитов за секунду (~$0.1 за секунду), что не много и не мало в современных реалиях.

Kling Image O1 — это уже чистой воды Nano Banana или FLUX.2. Модель понимает семантику и может генерить пейзажи по скриншоту Google Карт. На вход — до 10 картинок. Черипики неплохие, но сравнивать с Nano Banana Pro нужно на практике. Главный плюс — всё в одном интерфейсе. Из минусов — в отличие от Gemini, сюда нельзя закинуть файл с текстом (например, презентацию). Что странно, нет и чата.

Kling Video 2.6 — это уже отдельная модель, обновление их флагмана. Главное нововведение — поддержка аудиовыхода: генерирует всё, от диалог, звуковых эффектов до музыки и пения. По качеству видео это всё ещё не уровень Veo, о чём косвенно говорит и отсутствие бенчмарков для этой версии.

Прочее:
- Avatar 2.0: Ответ HeyGen и прочим. Генерирует говорящую голову с движением рук и тела. Главная фишка — длина видео до 5 минут.
- O1 Elements: Загружаешь картинку объекта, и сервис автоматически генерит «элемент» — набор изображений с разных сторон для лучшей консистентности + он работает как продвинутая референс картинка.

Здорово, что Kling позиционирует себя как инструмент для AI-продакшена и идёт в качество, а не в шаблоны, как это делают Higgsfield и другие агрегаторы. Sora здесь стоит особняком: её не назовёшь ни агрегатором, ни инструментом для топового AI-продакшена.

Главный релиз — это, конечно же, Kling Video O1 с его SOTA-уровнем редактирования. Остальные модельки не так прорывны и имеют аналоги получше. Но так как Kling Image O1 очень похожа на Nano Banana, кажется, что скоро Google порадует нас своей ответочкой для видео.

@ai_newz
555👍19❤‍🔥5🔥32😍1
Нейродайджест за неделю (#97)

LLM
- DeepSeek V3.2 и V3.2 Speciale — Новые модели, сравнимые с GPT-5 High. Speciale-версия берёт золото на олимпиадах по математике и информатике.
- Mistral Large 3 — Мультимодальная модель на архитектуре DeepSeek V3, но не SOTA даже в опенсорсе, зато мультимодальная. Вместе с ней вышли и новые Ministral.
- Opus 4.5 в Claude Code для Pro-подписчиков — Лучшая модель для кода теперь доступна и в подписке за $20.

Генеративные модели
- Runway Gen-4.5 — Тот самый Whisper Thunder. Новая видеомодель побила Veo 3 на арене ELO.
- Kling's Omni Launch Week — Разбор релизов: Kling Video O1, мощный видеоредактор. Image O1, Video 2.6 с генерацией аудио и Avatar 2.0.

Прочее
- 500+ промптов для Nano Banana Pro — Библиотека промптов для вдохновения.

Личное
- Включение из Стамбула — Репортаж с финала Yandex Cup, нетворкаю и ханчу ребят в GenPeach AI.

> Читать дайджест #96

#дайджест
@ai_newz
128👍16🔥9
Ramanujan-1 — совсем без Nvidia

Стартап Essential AI, основанный Ashish Vaswani, тем самым что [Vaswani et al., 2017], выпустил свою первую модель. Тренировали эту 8B модель на смеси AMD MI300x и Google TPU v5p, при этом вся тренировка работает у них на Jax. Команда хвастается MFU в 50% на MI300x, правда речь, похоже, идёт о bf16.

На претрейн и инстракт бенчах модель выдаёт результаты сопоставимые с Qwen 3 8B, несмотря на то что на её тренировку было использовано в 4 раза меньше компьюта. Но по настоящему она сияет в агентском кодинге — на SWE-bench Verified Ramanujan-1 выдаёт феноменальные для такого размера 20,8. Другие модели в этой весовой категории выдают околонулевые результаты, поэтому их на таком сложном бенчмарке обычно не тестят.

Команда стартапа всего около 20 человек, так что релиз очень сфокусированный — модель выпустили всего в одном размере, на стоковой архитектуре Gemma, без ризонинг варианта и с крохотным контекстом в 32к. Но фундамент для будущих релизов заложен хороший, ждём пока ребята заскейлятся.

Веса
Блогпост
Демо

@ai_newz
1122👍56🔥25❤‍🔥1😁1💯1
Привет, фаундеры в чате есть? Как вы искали себе Executive Assistant и как собеседовали? Буду благодарен советам.

Меня как CEO начала засасывать админ работа в нашем стартапе, и кажется пора найти человека, который смог бы меня разгрузить в этих делах.

Ниже последуюет сама вакансия - вдруг кто-то сможет пореферить идеального кандидата.

---

🚀 Executive Assistant (Remote, Europe — Preferably Poland)
Join GenPeach.ai, an early-stage European AI startup (ex-Meta founders, backed by investors from DeepMind, Microsoft AI, Meta & OpenAI).

We’re building next-gen generative AI models for realistic image & video creation — and we need an EA to keep our fast, technical team running smoothly.

You will:
• Manage CEO calendar, inbox & comms
• Coordinate travel, meetings & logistics
• Support hiring, onboarding & people ops
• Handle docs, contracts & knowledge management

We offer:
• Competitive salary
• Path to Chief of Staff
• Flexible hours, fully remote (EU time)
• Work with elite AI team
• Rapid learning & real impact
• Team meetings/offsites across Europe

Requirements:
• English B2+/ C1 (strong written & verbal communication).
• Excellent organization, time management, and attention to detail.
• Comfortable working in a fast-paced, changing startup environment.
• Proactive, independent, and reliable — able to anticipate needs.
• Tech-savvy; quick to learn tools like Airtable, Jira, Slack, Zapier.
• Experience as an EA or in operations at a startup/tech company.

🔗 More info: link
📩 Apply: [email protected] (please send an email with the tag “[EA job application]” in the subject)

@ai_newz
7🔥43😁3014🦄13🙏1💔1
Обычно с дизайном мерча, который компании раздают на всех технических конфах, все довольно грустно. Исключения на моем опыте - это разве что раритетная шапка от Google, которую я взял на Neurips в 2016 и кепка "GPU poor" от fal.

Очень часто мерч выглядит по-детски либо кринжово. Не хватает классного технарьского шмота настолько, что мне даже пришлось задизайнить самому и напечатать для себя несколько футболок с ai приколами.

Недавно на глаза попался мерч от Cloud․ru в коллабе с дизайнером Глебом Костиным (см картинки) - выглядит довольно прикольно, и посвящен запуску новой платформы для работы с GenAI.

Кстати, накидайте в комменты примеров классного мерча, который вам нравится.

@ai_newz
1👍58😁22🫡97🤩7🔥4🤯3💔2💯1
Devstral 2 — локальный вайбкодинг

После разочаровывающего релиза Mistral Large 3, компания показала что не всё потеряно. Devstral Small 2, при 24 миллиардах параметров, набирает 68.0 на SWE Bench Verified, что уровень GLM 4.6. Модельку, на минуточку, можно запускать локально. А полноценная Devstral 2 — почти на уровне лучших открытых моделей.

Кроме этого Mistral выпустили Vibe CLI, своего конкурента Claude Code/Codex. К сожалению работает только через API, к локальной модельке подключаться не позволяет.

Маленькая модель доступна по Apache 2.0, большая по кастомной лицензии. Первое время модели в API бесплатные.

Веса 24B
Веса 123B
Vibe CLI

@ai_newz
1👍8319🔥12💔3🦄2😁1
2025/12/12 01:58:57
Back to Top
HTML Embed Code: