group-telegram.com/ai_machinelearning_big_data/7640
Last Update:
ΠΡΠ»Π΅Π΄ Π·Π° ΡΠ΅Π»ΠΈΠ·ΠΎΠΌ Hunyuan Portrait, Tencent Π²ΡΠΏΡΡΡΠΈΠ»Π° Hunyuan Video Avatar - ΡΠΈΡΡΠ΅ΠΌΡ Π½Π° Π±Π°Π·Π΅ MM-DiT Π΄Π»Ρ Π³Π΅Π½Π΅ΡΠ°ΡΠΈΠΈ Π΄ΠΈΠ½Π°ΠΌΠΈΡΠ½ΡΡ
Π²ΠΈΠ΄Π΅ΠΎ ΠΈΠ· ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Ρ ΠΎΠ΄Π½ΠΈΠΌ ΠΈΠ»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΈΠΌΠΈ ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠ°ΠΌΠΈ, ΡΠΈΠ½Ρ
ΡΠΎΠ½ΠΈΠ·ΠΈΡΠΎΠ²Π°Π½Π½ΡΡ
Ρ Π°ΡΠ΄ΠΈΠΎ.
ΠΠ±ΡΠ΅Π΄ΠΈΠ½ΠΈΡΡ ΡΠ°ΠΊΠΈΠ΅ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡΠΈ Π±ΡΠ»ΠΎ Π½Π΅ΠΏΡΠΎΡΡΠΎΠΉ Π·Π°Π΄Π°ΡΠ΅ΠΉ, ΡΡΠΎ ΡΡΠ°Π»ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΠΌ Π±Π»Π°Π³ΠΎΠ΄Π°ΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΊΠ»ΡΡΠ΅Π²ΡΡ
Π΄Π»Ρ Hunyuan Video Avatar ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ²:
ΠΠΎ ΡΡΠ°Π²Π½ΠΈΡΠ΅Π»ΡΠ½ΡΡ
ΡΠ΅ΡΡΠ°Ρ
Ρ Sonic, EchoMimic, EchoMimicV2 ΠΈ Hallo-3 Π½Π° Π΄Π°ΡΠ°ΡΠ΅ΡΠ°Ρ
Π΄Π»Ρ ΠΏΠΎΡΡΡΠ΅ΡΠ½ΠΎΠΉ Π°Π½ΠΈΠΌΠ°ΡΠΈΠΈ (HDTF, CelebV-HQ ΠΈ ΡΠ²ΠΎΠΉ ΠΏΡΠΈΠ²Π°ΡΠ½ΡΠΉ ΡΠ΅Ρ) Hunyuan Video Avatar ΠΏΠΎΠΊΠ°Π·Π°Π» Π»ΡΡΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ: 3,99 Π² ΠΌΠ΅ΡΡΠΈΠΊΠ°Ρ
ΠΊΠ°ΡΠ΅ΡΡΠ²Π° Π²ΠΈΠ΄Π΅ΠΎ (IQA), 2,54 ΠΏΠΎ ΡΡΡΠ΅ΡΠΈΠΊΠ΅ (ASE), 5,30 Π² ΡΠΈΠ½Ρ
ΡΠΎΠ½ΠΈΠ·Π°ΡΠΈΠΈ Π°ΡΠ΄ΠΈΠΎ ΠΈ Π²ΠΈΠ΄Π΅ΠΎ (Sync-C), 38.01 Π² ΡΠΎΡΠ½ΠΎΡΡΠΈ Π²ΠΎΡΠΏΡΠΎΠΈΠ·Π²Π΅Π΄Π΅Π½ΠΈΡ Π²ΠΈΠ΄Π΅ΠΎ (FID) ΠΈ 358.71 ΠΏΠΎ ΠΈΡΠΊΠ°ΠΆΠ΅Π½ΠΈΡΠΌ (FVD).
ΠΡΠΈ ΡΠ΅ΡΡΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠΎΠ»Π½ΠΎΠΊΠ°Π΄ΡΠΎΠ²ΠΎΠΉ Π°Π½ΠΈΠΌΠ°ΡΠΈΠΈ Π½Π° ΡΠΎΠ±ΡΡΠ²Π΅Π½Π½ΠΎΠΌ Π΄Π°ΡΠ°ΡΠ΅ΡΠ΅ HunyuanVideo-Avatar ΠΏΠΎΠΊΠ°Π·Π°Π» Π»ΡΡΡΠΈΠ΅ ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΡ ΠΏΠΎ IQA (4.66), ASE (3.03) ΠΈ Sync-C (5.56) Π² ΡΡΠ°Π²Π½Π΅Π½ΠΈΠΈ Ρ Hallo3, FantasyTalking ΠΈ OmniHuman-1.
β οΈ ΠΠΎΠ΄Π΅Π»Ρ ΠΏΡΠΎΠΆΠΎΡΠ»ΠΈΠ²Π°Ρ: ΠΌΠΈΠ½ΠΈΠΌΡΠΌ 24 ΠΠ VRAM Π΄Π»Ρ 704x768, Π° Π΄Π»Ρ ΠΏΠ»Π°Π²Π½ΠΎΠ³ΠΎ 4K ΡΠ΅ΠΊΠΎΠΌΠ΅Π½Π΄ΡΡΡ GPU Π½Π° 96 ΠΠ.
ΠΠ°ΡΠΎ Π²Ρ
ΠΎΠ΄Π½ΡΠ΅ ΠΈΠ·ΠΎΠ±ΡΠ°ΠΆΠ΅Π½ΠΈΡ Π±Π΅ΡΠ΅Ρ Π»ΡΠ±ΡΠ΅: ΡΠΎΡΠΎΡΠ΅Π°Π»ΠΈΡΡΠΈΡΠ½ΡΠ΅ ΠΏΠΎΡΡΡΠ΅ΡΡ, 3D-ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π°Π½ΠΈΠΌΠ΅-ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠΈ β Ρ
ΠΎΡΡ Π»ΠΈΡΡ Π² ΠΊΠΎΡΡΡΠΌΠ΅. Π Π°Π·ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΡΠΎΠΆΠ΅ Π³ΠΈΠ±ΠΊΠΎΠ΅: ΠΎΡ ΠΊΡΡΠΏΠ½ΡΡ
ΠΏΠ»Π°Π½ΠΎΠ² Π΄ΠΎ ΠΏΠΎΠ»Π½ΠΎΡΠΎΡΡΠΎΠ²ΡΡ
.
@ai_machinelearning_big_data
#AI #ML #HunyuanAvatar