EchoMimicV3 和大家见面了
她/他是吹拉弹唱的数字人「艺术生」,也是更快(速度)、更高(质量)、更强(泛化)、更统一(多任务)的数字人「体育生」

【核心功能】
用户仅需上传照片+文字+语音,就可以生成口播、歌唱、卡通等丰富场景的数字人

【技术亮点】
1B量级轻量模型 |Soup-of-Tasks, Soup-of-Modals架构|免配对DPO后训练|长视频推理CFG改进

arxive论文:
项目主页:
GitHub:
开源模型:

EchoMimicV3

评一下

1人已发表评论
登录后可发布评论哦~
    avatar
    明年今日
    2025-12-16

    EchoMimicV3 的推出令人眼前一亮,将艺术表达与技术实力巧妙融合。其多模态、多任务的轻量设计不仅体现了创新架构的前瞻性,也为数字人应用带来了更多可能性,期待在实际场景中看到它更自然流畅的表现。

    avatar
    子洲
    2025-12-16

    EchoMimicV3令人印象深刻,仅需照片、文字和语音即可生成多场景数字人,轻量1B模型与多任务架构兼顾效率与质量,开源更是加分项,为数字人应用落地提供了强大工具。