Telegram Group Search
LongCat-Video

Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной

Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров

Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN

Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.

Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.

Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)

Позиционируют модель как "первый шаг к модели мира"

Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ

Ждем кванты и воркфлоу?

Спасибо @m_franz

#text2video #image2video #video2video
🔥22😱62👍1👎1
Полноценный гайд, как правильно зарегистрировать аккаунт в Grok с проверкой возраста и генерацией nsfw. Сам не проверял еще.

0. Перед началом работы, убедись что у тебя есть смартфон и VPN на смартфоне.
Если у тебя Android, скачай модифицированный клиент с 4пда: https://4pda.to/forum/index.php?showtopic=1102932&view=findpost&p=139711943
Если у тебя iOS, скачай из маркета, если есть доступ.

1. Включаешь VPN на смартфоне
2. Регистрируешь фейкопочту (рекомендую https://minmail.app/ru)
3. Заходишь в браузер по умолчанию на grok.com, выходишь из приложения
4. В браузере же, регистрируешь аккаунт на фейкопочту и завершаешь процесс регистрации
5. Заходишь в приложение, жмёшь Sign In по почте, тебя кидает в браузер, авторизация проходит
6. Возвращаешься в приложение, открываешь настройки, снимаешь галку с "Генерировать видео по фото сразу"
7. Заходишь в Grok Image, загружаешь одетую девушку и пишешь промт "spice"
8. Вылезет окно запроса возраста, указываешь год рождения "2000" или меньше
9. Проверяешь что генерация запустилась
:!: Кнопки "Spicy" в режимах может не быть, она не роляет.
10. Теперь самое интересное, начинаем генерить сиськи:
10.1. Берешь одетую девушку, открываешь в редакторе изображений
10.2. Сбоку или в угол вставляешь изображение сиськи (сиська должна быть не сильно большой, смотри первую секунду в приложенных видрилах)
10.3. Грузишь это изображение в Imagine и запускаешь генерацию вообще без промпта.

Источник

#instruction #guide
👍10😁63
DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

Повышалка разрешения предварительно обученных генераторов картинок

Дотягивает разрешение до 4K × 4K и выше

Учитывает временную составляющую и прогресс в появлении деталей в процессе деноизинга

При это не требует ни дообучения, ни дополнительных затрат на сэмплирование

На примерах - Flux+DyPE

Код

#text2image #optimization #enlargeyourimage
👍83🤔1
отличить набросы от реальности все труднее

грустный #humor
😁14👀9😐3🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
роботы против дисплейно-клавиатурных подстилок кожаных мешков

#robot
😁14👨‍💻2😱1
Audio Flamingo 3

аудиоязыковая модель от NVIDIA

Русский понимает. Собачий - навряд ли. Но делает вид что понимает.

Умеет:

— понимать необычные звуки;

— работать с длинными аудио (до 10 минут);

— вести многоходовые диалоги с несколькими аудиозаписями;

— генерировать шаги рассуждения;

— общаться голосом;

— обрабатывать речь, звуки и музыку с помощью единого энкодера.

В основе модели — энкодер Whisper large-v3 с Transformer-декодером

Гитхаб - кажется кода нет
HF
Демо

#alm #audio2text #voicemode
👍7😁21
This media is not supported in your browser
VIEW IN TELEGRAM
Slapshot.ai

онлайн маски, карты глубины, ретайм.
А теперь еще завезли трекинг камеры.

#tracking #video2mask #video2depth
👍6
Media is too big
VIEW IN TELEGRAM
Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Превращает спутниковые снимки в гауссовы 3D-сцены городов. Модель создаёт реалистичные сцены без дорогих 3D-аннотаций, позволяет их исследовать в реальном времени.

Код
Пачка демо сцен в формате .ply

#gaussian #image2scene #map2scene #mapto3d
11🔥5👍2
Media is too big
VIEW IN TELEGRAM
Arca Gidan Prize

Художественный конкурс, посвященный открытым моделям.

При поддержке ComfyUI и banodoco.ai

Недельный творческий спринт, который призывает художников раскрыть свой потенциал, комбинируя открытые ИИ-модели с творческими амбициями.

Цели конкурса:

помочь людям обнаружить свой творческий потенциал

продемонстрировать возможности опенсорса и вдохновить других на создание и использование открытых ИИ-инструментов.

Призы:

четыре победителя получат возможность представить свои работы на мероприятии ADOS LA в Голливуде (Mack Sennett Studios);

оплата перелёта и проживания;

стипендия на покрытие расходов;

гигантский Toblerone (4,5 кг) в качестве трофея.

Победителей выберут путём публичного голосования в двух номинациях: «Лучшее в целом» (2 победителя) и «Лучшее по инструментам» (по одному победителю за лучшее использование Comfy и Reigh).

#news #competition
👍9
DeepAgent: A General Reasoning Agent with Scalable Toolsets

Агент, отличается от других систем тем, что работает как единый механизм, а не следует заранее заданным сценариям

Может работать с моделями Qwen и вероятно другими vLLM

— самостоятельно мыслит и действует

— находит нужные инструменты по мере необходимости

— сжимает историю взаимодействий, чтобы не запутаться в большом объёме данных и не накапливать ошибки

— работает с более чем 16 000 API

— справляется с задачами, связанными с навигацией и взаимодействием с окружением (например, веб-сёрфинг, взаимодействие с операционной системой)

Гитхаб

#agent #assistant
👍5
Music GPT v6 Pro

Прислали письмо с доступом к новой версии генератора музыки

Проверьте, может вам тоже прислали

Заявленные обновления:

* Чистый микс, насыщенный звук, естественный вокал.
* Точная передача эмоций и стиля.
* Лирика, рассказывающая искренние истории

Еще не пробовал

#musicediting #text2music #tts #text2audio
👍6👎1
Все топовые нейросети — в одном месте! 🤩

Ты уже в игре: генеришь промпты, тестишь апдейты моделей и следишь за каждым новым релизом? Теперь можно не искать, где оплатить подписку — всё нужное собрано на Kupikod!

Здесь: ChatGPT, Claude, Gemini, Midjourney, Perplexity, Cursor, Suno, Character и другие мощные ИИ-инструменты.

Покупай подписки:

быстро и безопасно;
в рублях — без VPN и зарубежных карт;
по лучшим ценам;
с кешбэком и промокодом NEURAL для дополнительной скидки.

Заходи на Kupikod и собери свой ИИ-набор

#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Посмотрите на картинку и выберите одного робота

Поздравляю, вы выбрали противника который будет гоняться за вами в восстании машин

#robot #humor
😁81
2025/10/28 02:34:25
Back to Top
HTML Embed Code: