EchoMimicV3 和大家见面了 她/他是吹拉弹唱的数字人「艺术生」,也是更快(速度)、更高(质量)、更强(泛化)、更统一(多任务)的数字人「体育生」 【核心功能】 用户仅需上传照片+文字+语音,就可以生成口播、...
EchoMimicV3 和大家见面了她/他是吹拉弹唱的数字人「艺术生」,也是更快(速度)、更高(质量)、更强(泛化)、更统一(多任务)的数字人「体育生」
【核心功能】用户仅需上传照片+文字+语音,就可以生成口播、歌唱、卡通等丰富场景的数字人
【技术亮点】1B量级轻量模型 |Soup-of-Tasks, Soup-of-Modals架构|免配对DPO后训练|长视频推理CFG改进
arxive论文:项目主页:GitHub:开源模型:
暂无数据
暂无数据