EchoMimicV3 和大家见面了
她/他是吹拉弹唱的数字人「艺术生」,也是更快(速度)、更高(质量)、更强(泛化)、更统一(多任务)的数字人「体育生」

【核心功能】
用户仅需上传照片+文字+语音,就可以生成口播、歌唱、卡通等丰富场景的数字人

【技术亮点】
1B量级轻量模型 |Soup-of-Tasks, Soup-of-Modals架构|免配对DPO后训练|长视频推理CFG改进

arxive论文:
项目主页:
GitHub:
开源模型:

EchoMimicV3

评一下

已发表评论
登录后可发布评论哦~

    暂无数据