HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
group-telegram.com/GreenNeuralRobots/6996
Create:
Last Update:
Last Update:
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
BY Нейронавт | Нейросети в творчестве
Share with your friend now:
group-telegram.com/GreenNeuralRobots/6996