熟悉 Midjourney、Stable Difusion 等 AI 绘画工具的朋友可能遇到这样一个问题:在图像中生成或嵌入精确的文本可能会比较困难。
现在不必太担心了,阿里巴巴集团的研究人员已经开源了一款名为 AnyText 的多语言视觉文字生成与编辑模型。
AnyText在生成文字方面的控制能力可以媲美专业的PS,用户可以自定义文字出现的位置,以及图片的强度、力度、种子数等参数。
目前,它在Github上已经获得了超过2,400颗星的好评。并且 AnyText 可以作为插件无缝集成到其他开源扩散模型中,从而全面增强了图像嵌入精准文本的能力。