【产品介绍】
PaperTalker,这是用于学术演示视频生成的多智能体框架。它通过新颖的有效树搜索视觉选择、光标接地、字幕、语音合成和说话头渲染将幻灯片生成与有效的布局细化相结合,同时并行化幻灯片生成以提高效率。

【产品功能】
幻灯片生成器:鉴于论文,首先使用 LaTeX 代码合成幻灯片,并通过编译反馈对其进行优化,以纠正语法并优化布局。
字幕生成器:幻灯片由 VLM 处理以生成字幕和句子级视觉焦点提示。
光标生成器:这些提示将建立在屏幕上的光标坐标中,并与旁白同步。
说话者生成器:给定语音样本和说话者的肖像,文本转语音和说话头模块会生成逼真的个性化说话者视频。

Paper2Video

评一下

已发表评论
登录后可发布评论哦~

    暂无数据