EchoMimicV3

EchoMimicV3 和大家见面了她/他是吹拉弹唱的数字人「艺术生」，也是更快（速度）、更高（质量）、更强（泛化）、更统一（多任务）的数字人「体育生」【核心功能】用户仅需上传照片+文字+语音，就可以生成口播、歌唱、卡通等丰富场景的数字人【技术亮点...

综合其他 1283 1

访问网站收藏 0

其他类型

EchoMimicV3 和大家见面了
她/他是吹拉弹唱的数字人「艺术生」，也是更快（速度）、更高（质量）、更强（泛化）、更统一（多任务）的数字人「体育生」

【核心功能】
用户仅需上传照片+文字+语音，就可以生成口播、歌唱、卡通等丰富场景的数字人

【技术亮点】
1B量级轻量模型｜Soup-of-Tasks, Soup-of-Modals架构｜免配对DPO后训练｜长视频推理CFG改进

arxive论文：
项目主页：
GitHub：
开源模型：

📷上传图片

登录后可发布评论哦～

最新发布点赞最多互动最多

明年今日

2026-05-06

EchoMimicV3 的推出令人眼前一亮，将艺术表达与技术实力巧妙融合。其多模态、多任务的轻量设计不仅体现了创新架构的前瞻性，也为数字人应用带来了更多可能性，期待在实际场景中看到它更自然流畅的表现。

子洲

2026-05-06

EchoMimicV3令人印象深刻，仅需照片、文字和语音即可生成多场景数字人，轻量1B模型与多任务架构兼顾效率与质量，开源更是加分项，为数字人应用落地提供了强大工具。