Telegram Group Search
Forwarded from эйай ньюз
Genie 2 – A large-scale foundation world model

Google DeepMind хвастаются своим игровым AI-движком на базе диффузионного генератора видео. Сейчас это модно назвать World Model, но давайте без булшита, друзья.

Imagen 3 (txt2img от GDM) генерирует картинку – типа начальное состояние игры. Затем, в привычной нам для img2video манере, картинку оживляют, превращая ее в игру, где дополнительным инпутом идет нажатие клавишь.

Пока что игра живёт лишь 60 секунд максимум (в среднем 10–20), но миры все крайне разнообразные и в абсолютно разных условиях. Я имею в виду вид от третьего лица, первого лица, сверху — и даже гонки можно сделать (и на лошади тоже), и просто бродилки, конечно же. Управление по классике: WASD (QE), пробел и мышь.

Также работает и взаимодействие с объектами, например, можно лопать шары, взрывать бочки и открывать двери на E. Там даже NPC-персонажей можно найти, если задать нужный входной "скрин".

Архитектура
Каких-то технических деталей по Genie 2 особо нет — Google на такие вещи довольно скупы. Из моего представления - там тупо latent diffusion image2video модель, где каждый следующих кадр постепенно генерируется, исходя из контекста, состоящего из существующих кадров и нажатий на клавиатуру/мышку.

Черипики с сайта сасные в плане diversity, но не ахти по качеству картинки. Возможно, через год-два каждый сможет сгенерировать себе мир по душе, так же как сейчас генерируют музыку в Suno.

Очевидно, до статуса играбельно ещё далеко. И я тут даже молчу о скорости генерации (об этом не пишут, но, думаю, там не совсем риалтайм). Несмотря на то, что у авторов были горы TPU для обучения и тысячи часов записанного геймплея, качество видео пока хуже PlayStation 1, картинка размытая, и нет четкости в деталях. Ну, и мир сильно плывет после 10–20 секунд. Есть куда улучшать.

Скоро в эту нишу могут вкатиться другие серьёзные игроки (ждём ответку от Маска). Вот тогда и посмотрим.

Блогпост

@ai_newz
Pydantic выкатил AI Agents Framework для валидации ответов LLM в проде

https://ai.pydantic.dev/
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI официально показали Sora!

Доступно будет всем подписчикам ChatGPT - и Plus и Pro. Дают кредитов на до 50 генераций в месяц Plus подписчикам и до 500 быстрых генераций Pro подписчикам. Pro подписчики с более 500 генераций попадают в "медленную очередь".

Длина видео всё таки от 5 до 20 секунд (для Plus максимум 5), а разрешение от 480p до 1080p (Plus подписчики ограничены 720p). На более длинные видео и видео разрешения уходит больше кредитов. К видео можно применять стили и создавать свои.

Показали Storyboard - продвинутый инструмент позволяющий режиссировать видео. К примеру можно попросить Sora сгенерить видео человека, который на пятой секунде видео машет рукой.

Ещё есть куча продвинутых инструментов - можно догенеривать до видео как начало так и концовку, смешивать несколько видео вместе разными способами и много чего ещё.

Модерация сейчас чрезмерно строгая, но OpenAI обещают постепенно снимать ограничения.

sora.com

@ai_newz
Накупил PEPE, пока рынок кровоточит. Ладошки потеют так жоска, что решил с вами поделиться. Есть в чате любители зеленого лягушонка?)
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI выкатили доступ к text-to-video модели Sora на время рождественских праздников.

Я решил применить искусственный интеллект по его истинному назначению.
Leetcode на выживание

Чувак организовал стрим по решению задач на Leetcode. Фишка в том, что отправка неправильного решения автоматически удаляет операционную систему на его компе.

Я в следующем году планирую опять набирать форму и готовиться к собесам, может стоит позаимствовать прием

https://youtu.be/nO7J6pBEkJw
Отмечал новый год в горах Юты. Держите фотки и саундтрек
Forwarded from 4ch
This media is not supported in your browser
VIEW IN TELEGRAM
Пожары в Калифорнии с ноткой ностальгии
Лол, Трамп в преддверии инаугурации запустил свой мемкоин. Чиста без страха, без уважения, памп, дамп и в президентское кресло.

Ну либо его твиттер взломали.

https://x.com/realDonaldTrump/status/1880446012168249386
Пакую чемоданы и сваливаю из США. Челы забанили тикток. Как жить то. Это уже ни в какие ворота…
GPT-4b

Ходят слухи, что на радость биохакерам из Кремниевой Долины, мужики из OpenAI занялись вопросом продления молодости.

Возможно Альтман посмотрел на Демиса с Нобелевкой за Alphafold и захотел также. А возможно просто может себе позволить, потому что зарядил $180M в некую Retro Biosciences, совместно с которой и учили модель.

Нейросети заберут у тебя работу и дадут бессмертие, чтобы ты наконец смог выбраться из 3к помойки в доте.

https://the-decoder.com/openais-new-gpt-4b-micro-model-optimizes-proteins-for-longevity-research/
Интересная статистика подъехала
2025/06/15 00:10:08
Back to Top
HTML Embed Code: