MagicAvatar是由字节跳动开发的多模态框架,它能够将各种输入模式(如文本、视频和音频)转换为运动信号,进而生成或激活一个虚拟形象(Avatar)。然后基于这些信号生成以形象为中心的视频。 以下是几种模式场景:...
MagicAvatar是由字节跳动开发的多模态框架,它能够将各种输入模式(如文本、视频和音频)转换为运动信号,进而生成或激活一个虚拟形象(Avatar)。然后基于这些信号生成以形象为中心的视频。
以下是几种模式场景:
暂无数据
暂无数据