This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
LongCat-Video
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN
Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.
Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.
Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)
Позиционируют модель как "первый шаг к модели мира"
Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ
Ждем кванты и воркфлоу?
Спасибо @m_franz
#text2video #image2video #video2video
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN
Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.
Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.
Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)
Позиционируют модель как "первый шаг к модели мира"
Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ
Ждем кванты и воркфлоу?
Спасибо @m_franz
#text2video #image2video #video2video
🔥22😱6❤2👍1👎1
Полноценный гайд, как правильно зарегистрировать аккаунт в Grok с проверкой возраста и генерацией nsfw. Сам не проверял еще.
0. Перед началом работы, убедись что у тебя есть смартфон и VPN на смартфоне.
Если у тебя Android, скачай модифицированный клиент с 4пда: https://4pda.to/forum/index.php?showtopic=1102932&view=findpost&p=139711943
Если у тебя iOS, скачай из маркета, если есть доступ.
1. Включаешь VPN на смартфоне
2. Регистрируешь фейкопочту (рекомендую https://minmail.app/ru)
3. Заходишь в браузер по умолчанию на grok.com, выходишь из приложения
4. В браузере же, регистрируешь аккаунт на фейкопочту и завершаешь процесс регистрации
5. Заходишь в приложение, жмёшь Sign In по почте, тебя кидает в браузер, авторизация проходит
6. Возвращаешься в приложение, открываешь настройки, снимаешь галку с "Генерировать видео по фото сразу"
7. Заходишь в Grok Image, загружаешь одетую девушку и пишешь промт "spice"
8. Вылезет окно запроса возраста, указываешь год рождения "2000" или меньше
9. Проверяешь что генерация запустилась
:!: Кнопки "Spicy" в режимах может не быть, она не роляет.
10. Теперь самое интересное, начинаем генерить сиськи:
10.1. Берешь одетую девушку, открываешь в редакторе изображений
10.2. Сбоку или в угол вставляешь изображение сиськи (сиська должна быть не сильно большой, смотри первую секунду в приложенных видрилах)
10.3. Грузишь это изображение в Imagine и запускаешь генерацию вообще без промпта.
Источник
#instruction #guide
0. Перед началом работы, убедись что у тебя есть смартфон и VPN на смартфоне.
Если у тебя Android, скачай модифицированный клиент с 4пда: https://4pda.to/forum/index.php?showtopic=1102932&view=findpost&p=139711943
Если у тебя iOS, скачай из маркета, если есть доступ.
1. Включаешь VPN на смартфоне
2. Регистрируешь фейкопочту (рекомендую https://minmail.app/ru)
3. Заходишь в браузер по умолчанию на grok.com, выходишь из приложения
4. В браузере же, регистрируешь аккаунт на фейкопочту и завершаешь процесс регистрации
5. Заходишь в приложение, жмёшь Sign In по почте, тебя кидает в браузер, авторизация проходит
6. Возвращаешься в приложение, открываешь настройки, снимаешь галку с "Генерировать видео по фото сразу"
7. Заходишь в Grok Image, загружаешь одетую девушку и пишешь промт "spice"
8. Вылезет окно запроса возраста, указываешь год рождения "2000" или меньше
9. Проверяешь что генерация запустилась
:!: Кнопки "Spicy" в режимах может не быть, она не роляет.
10. Теперь самое интересное, начинаем генерить сиськи:
10.1. Берешь одетую девушку, открываешь в редакторе изображений
10.2. Сбоку или в угол вставляешь изображение сиськи (сиська должна быть не сильно большой, смотри первую секунду в приложенных видрилах)
10.3. Грузишь это изображение в Imagine и запускаешь генерацию вообще без промпта.
Источник
#instruction #guide
👍10😁6❤3
DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion
Повышалка разрешения предварительно обученных генераторов картинок
Дотягивает разрешение до 4K × 4K и выше
Учитывает временную составляющую и прогресс в появлении деталей в процессе деноизинга
При это не требует ни дообучения, ни дополнительных затрат на сэмплирование
На примерах - Flux+DyPE
Код
#text2image #optimization #enlargeyourimage
Повышалка разрешения предварительно обученных генераторов картинок
Дотягивает разрешение до 4K × 4K и выше
Учитывает временную составляющую и прогресс в появлении деталей в процессе деноизинга
При это не требует ни дообучения, ни дополнительных затрат на сэмплирование
На примерах - Flux+DyPE
Код
#text2image #optimization #enlargeyourimage
👍8❤3🤔1
Audio Flamingo 3
аудиоязыковая модель от NVIDIA
Русский понимает. Собачий - навряд ли. Но делает вид что понимает.
Умеет:
— понимать необычные звуки;
— работать с длинными аудио (до 10 минут);
— вести многоходовые диалоги с несколькими аудиозаписями;
— генерировать шаги рассуждения;
— общаться голосом;
— обрабатывать речь, звуки и музыку с помощью единого энкодера.
В основе модели — энкодер Whisper large-v3 с Transformer-декодером
Гитхаб - кажется кода нет
HF
Демо
#alm #audio2text #voicemode
аудиоязыковая модель от NVIDIA
Русский понимает. Собачий - навряд ли. Но делает вид что понимает.
Умеет:
— понимать необычные звуки;
— работать с длинными аудио (до 10 минут);
— вести многоходовые диалоги с несколькими аудиозаписями;
— генерировать шаги рассуждения;
— общаться голосом;
— обрабатывать речь, звуки и музыку с помощью единого энкодера.
В основе модели — энкодер Whisper large-v3 с Transformer-декодером
Гитхаб - кажется кода нет
HF
Демо
#alm #audio2text #voicemode
👍7😁2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Slapshot.ai
онлайн маски, карты глубины, ретайм.
А теперь еще завезли трекинг камеры.
#tracking #video2mask #video2depth
онлайн маски, карты глубины, ретайм.
А теперь еще завезли трекинг камеры.
#tracking #video2mask #video2depth
👍6
Media is too big
VIEW IN TELEGRAM
Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery
Превращает спутниковые снимки в гауссовы 3D-сцены городов. Модель создаёт реалистичные сцены без дорогих 3D-аннотаций, позволяет их исследовать в реальном времени.
Код
Пачка демо сцен в формате .ply
#gaussian #image2scene #map2scene #mapto3d
Превращает спутниковые снимки в гауссовы 3D-сцены городов. Модель создаёт реалистичные сцены без дорогих 3D-аннотаций, позволяет их исследовать в реальном времени.
Код
Пачка демо сцен в формате .ply
#gaussian #image2scene #map2scene #mapto3d
❤11🔥5👍2
Media is too big
VIEW IN TELEGRAM
Arca Gidan Prize
Художественный конкурс, посвященный открытым моделям.
При поддержке ComfyUI и banodoco.ai
Недельный творческий спринт, который призывает художников раскрыть свой потенциал, комбинируя открытые ИИ-модели с творческими амбициями.
Цели конкурса:
помочь людям обнаружить свой творческий потенциал
продемонстрировать возможности опенсорса и вдохновить других на создание и использование открытых ИИ-инструментов.
Призы:
четыре победителя получат возможность представить свои работы на мероприятии ADOS LA в Голливуде (Mack Sennett Studios);
оплата перелёта и проживания;
стипендия на покрытие расходов;
гигантский Toblerone (4,5 кг) в качестве трофея.
Победителей выберут путём публичного голосования в двух номинациях: «Лучшее в целом» (2 победителя) и «Лучшее по инструментам» (по одному победителю за лучшее использование Comfy и Reigh).
#news #competition
Художественный конкурс, посвященный открытым моделям.
При поддержке ComfyUI и banodoco.ai
Недельный творческий спринт, который призывает художников раскрыть свой потенциал, комбинируя открытые ИИ-модели с творческими амбициями.
Цели конкурса:
помочь людям обнаружить свой творческий потенциал
продемонстрировать возможности опенсорса и вдохновить других на создание и использование открытых ИИ-инструментов.
Призы:
четыре победителя получат возможность представить свои работы на мероприятии ADOS LA в Голливуде (Mack Sennett Studios);
оплата перелёта и проживания;
стипендия на покрытие расходов;
гигантский Toblerone (4,5 кг) в качестве трофея.
Победителей выберут путём публичного голосования в двух номинациях: «Лучшее в целом» (2 победителя) и «Лучшее по инструментам» (по одному победителю за лучшее использование Comfy и Reigh).
#news #competition
👍9
DeepAgent: A General Reasoning Agent with Scalable Toolsets
Агент, отличается от других систем тем, что работает как единый механизм, а не следует заранее заданным сценариям
Может работать с моделями Qwen и вероятно другими vLLM
— самостоятельно мыслит и действует
— находит нужные инструменты по мере необходимости
— сжимает историю взаимодействий, чтобы не запутаться в большом объёме данных и не накапливать ошибки
— работает с более чем 16 000 API
— справляется с задачами, связанными с навигацией и взаимодействием с окружением (например, веб-сёрфинг, взаимодействие с операционной системой)
Гитхаб
#agent #assistant
Агент, отличается от других систем тем, что работает как единый механизм, а не следует заранее заданным сценариям
Может работать с моделями Qwen и вероятно другими vLLM
— самостоятельно мыслит и действует
— находит нужные инструменты по мере необходимости
— сжимает историю взаимодействий, чтобы не запутаться в большом объёме данных и не накапливать ошибки
— работает с более чем 16 000 API
— справляется с задачами, связанными с навигацией и взаимодействием с окружением (например, веб-сёрфинг, взаимодействие с операционной системой)
Гитхаб
#agent #assistant
👍5
Kijai LongCat-Video_comfy
А вот и пригодные к упортеблению веса новичка LongCat-Video от Kijai
Не проверял, но его поддержка в WanVideoWrapper уже должна быть, соответствующие файлы в репо имеются
Спасибо @m_franz
#text2video #image2video #video2video
А вот и пригодные к упортеблению веса новичка LongCat-Video от Kijai
Не проверял, но его поддержка в WanVideoWrapper уже должна быть, соответствующие файлы в репо имеются
Спасибо @m_franz
#text2video #image2video #video2video
Telegram
Нейронавт | Нейросети в творчестве
LongCat-Video
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту…
Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной
Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров
Умеет создавать видео по тексту…
👍14
Music GPT v6 Pro
Прислали письмо с доступом к новой версии генератора музыки
Проверьте, может вам тоже прислали
Заявленные обновления:
* Чистый микс, насыщенный звук, естественный вокал.
* Точная передача эмоций и стиля.
* Лирика, рассказывающая искренние истории
Еще не пробовал
#musicediting #text2music #tts #text2audio
Прислали письмо с доступом к новой версии генератора музыки
Проверьте, может вам тоже прислали
Заявленные обновления:
* Чистый микс, насыщенный звук, естественный вокал.
* Точная передача эмоций и стиля.
* Лирика, рассказывающая искренние истории
Еще не пробовал
#musicediting #text2music #tts #text2audio
👍6👎1
Все топовые нейросети — в одном месте! 🤩
Ты уже в игре: генеришь промпты, тестишь апдейты моделей и следишь за каждым новым релизом? Теперь можно не искать, где оплатить подписку — всё нужное собрано на Kupikod!
Здесь: ChatGPT, Claude, Gemini, Midjourney, Perplexity, Cursor, Suno, Character и другие мощные ИИ-инструменты.
Покупай подписки:
⚫ быстро и безопасно;
⚫ в рублях — без VPN и зарубежных карт;
⚫ по лучшим ценам;
⚫ с кешбэком и промокодом NEURAL для дополнительной скидки.
Заходи на Kupikod и собери свой ИИ-набор❤
#промо
Ты уже в игре: генеришь промпты, тестишь апдейты моделей и следишь за каждым новым релизом? Теперь можно не искать, где оплатить подписку — всё нужное собрано на Kupikod!
Здесь: ChatGPT, Claude, Gemini, Midjourney, Perplexity, Cursor, Suno, Character и другие мощные ИИ-инструменты.
Покупай подписки:
Заходи на Kupikod и собери свой ИИ-набор
#промо
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Посмотрите на картинку и выберите одного робота
Поздравляю,вы выбрали противника который будет гоняться за вами в восстании машин
#robot #humor
Поздравляю,
#robot #humor
😁8❤1
