阿里达摩院发布的AnyText项目看起来非常出色,它能够生成与原始图片风格相融合的文字,或者对图片中的文字进行修改,同时支持中文!

AnyText项目包括两个核心模块:一个潜在特征模块和一个文本嵌入模块。潜在特征模块使用文本字形、位置和蒙版图像等输入,生成用于文本生成或编辑的潜在特征。文本嵌入模块则利用OCR模型将笔画数据转化为嵌入,再与来自标记器的图像标题嵌入相结合,生成能够与背景无缝融合的文本。

为了提高书写的准确性,AnyText采用了两种损失函数进行训练:文本控制扩散损失和文本感知损失。

评论交流3

登录后可发布评论哦~
    avatar
    黄某
    2026-05-09

    体验了一下Text,感觉这个项目挺贴心的。平时修图加中文总觉得兀,它能比较自然地把文字融进背景里,确实解决了不少小痛点。复杂背景的融合还有提升,但整体已经相当实用,期待后续更完善。

    avatar
    阮先生
    2026-05-09

    体验了下AnyText,感觉挺用心的。它在图片上加字或改字的效果比较自然,对中文的支持更是让人感到贴心,文字和背景融合得十分协调。虽然个别复杂细节或许还有进步空间,但整体表现已经相当实用,推荐尝试。

    avatar
    哈哈哈哈
    2026-05-09

    体验了下AnyText,感觉蛮贴心的。它生成的文字能自然融入原图,修改图片上的中文也很和谐。虽然在复杂背景下偶尔还需微调,但对日常做图来说,已经是个非常实用且值得尝试的辅助小工具了。