阿里达摩院出手，AI终于学会写汉字了

作者：铁华团的黄金船发布时间：2024-01-02

Stable Diffusion

众所周知，AI不太识字。

以Stable Diffusion为例，在SD1.5的时候，几乎无法正常画出文字。

到了SDXL1.0时代，可以识别简单的英文和数字。

但是对于汉字，依然无能为力。你让它写字，经常一本正经的不懂装懂。

我甚至还写了一篇文章，介绍为什么现阶段AI无法画出汉字来，其中的难点在哪。

没想到很快被打脸。

近日，阿里达摩院推出了一个程序，可以完美实现让AI写出汉字。

我翻了翻这个程序的样例，震惊了。不是普通的会写字，是真正的和原图融为一体了。

不得不佩服阿里的水准。

创作团队称，AnyText 包含一个扩散管道，有两个主要元素：一个辅助潜在模块和一个文本嵌入模块。

前者使用诸如文本字形、位置和遮罩图像等输入来生成文本生成或编辑的潜在特征。

后者采用 OCR 模型将笔画数据编码为嵌入，这些嵌入与分词器的图像标题嵌入混合以生成与背景无缝集成的文本。我们在训练过程中采用了文本控制扩散损失和文本感知损失，以进一步提高书写准确性。

AnyText的应用场景

广告设计：设计师可以使用AnyText生成多语言的广告文案。
电商产品展示：电商平台可以利用AnyText在商品图片上添加详细的商品信息。
社交媒体内容创作：内容创作者可以使用AnyText制作具有吸引力的文本图像，提高社交媒体帖子的互动和吸引力。

AnyText的产品特点

多语言文本生成：支持多种语言的输入和输出，适用于全球用户。
图像中文本渲染：在图像中渲染的文本既准确又连贯，使合成图像看起来更加真实。
文本编辑和优化：提供了丰富的编辑功能，让用户可以根据具体需求对生成的图像进行调整和优化。

几点不足：一是目前还没有WebUI插件，安装和调试比较不便；二是支持的模型也比较少。

期待尽快推出WebUI插件，可以方便的在Stable Diffusion进行操作。

代码：https://github.com/tyxsspa/AnyText

体验：https://modelscope.cn/studios/damo/studio_anytext/summary

论文：https://arxiv.org/abs/2311.03054

近期资讯

华为手机截屏功能详解：多样化操作与实用技巧分享

在现代社会，手机已经成为我们生活中不可或缺的一部分，尤其是像华为这样的品牌，它们的手机以高性能和丰富的功能受到很多人的喜爱。今天，我们就聊聊华为手机的截屏功能，这个功能看似简单，但在日常使用中却能带来不少便利。无论是想保存一段有趣的聊天记录，还是要记录下某个网页的信息，截屏都是最方便的一种方式。

新报观察 2024-12-28

曼恩斯特取得单段烘干单元 NMP 回收装置及烘干系统专利，适配性更高

金融界2024年12月28日消息，国家知识产权局信息显示，深圳市曼恩斯特科技股份有限公司取得一项名为“一种单段烘干单元NMP回收装置及烘干系统”的专利，授权公告号CN222211162U，申请日期为2024年1月。专利摘要显示，本实用新型涉及涂布机及涂布烘箱的技术领域，尤其是涉及一种单段烘干单元NMP回收装置及烘干系统。

金融界 2024-12-28

解决电脑数字键盘锁定问题的简单方法与技巧

这种情况可能让你在输入数字时感到很烦恼，尤其是在需要频繁输入数字的工作中，比如做表格、财务计算等等。今天我们就来聊聊怎么解锁键盘上的数字键，让这个小问题变得简单易解决。

新报观察 2024-12-28

在OPPO手机上轻松截取长图的详细步骤与注意事项指南

在日常生活中，手机截图已经成为我们记录信息、分享内容的重要方式。尤其是当我们需要截取长图时，很多人可能会感到困惑。今天，我们就来聊聊如何在OPPO手机上轻松截取长图，让你在分享信息时更加得心应手。长图，顾名思义，就是比普通截图更长的图片。它可以包含更多的信息，比如聊天记录、网页内容、文章等。

新报观察 2024-12-28

如何删除搜索记录保护隐私：实用方法与技巧汇总

在互联网时代，搜索记录几乎是每个人上网时的“隐私”。无论你是使用手机还是电脑，搜索引擎都会记录下你输入的每一个关键词。今天就来聊聊怎么删除搜索记录这个话题，看看怎么让你的上网体验更私密。先说说为什么要删除搜索记录。

新报观察 2024-12-28

广州天幸机电取得用于PCB板水平电镀循环节水专利，降低水资源损耗

金融界2024年12月28日消息，国家知识产权局信息显示，广州天幸机电设备有限公司取得一项名为“一种用于PCB板水平电镀的循环节水装置”的专利，授权公告号CN222211168U，申请日期为2024年5月。专利摘要显示，本实用新型涉及PCB清洗设备技术领域，具体为一种用于PCB板水平电镀的循环节水装置。

金融界 2024-12-28

常州吉邦药化机械取得卧式圆盘连续干燥冷却机专利，在机内完成干燥后即可冷却无需额外设备，提高效率节省场地空间

金融界2024年12月28日消息，国家知识产权局信息显示，常州吉邦药化机械工程有限公司取得一项名为“一种卧式圆盘连续干燥冷却机”的专利，授权公告号CN222211153U，申请日期为2024年4月。

金融界 2024-12-28

神州心辰取得一种可再生能源恒温干燥炉专利，在利用气流驱动时可减少其他能源消耗

金融界2024年12月28日消息，国家知识产权局信息显示，北京神州心辰科技有限公司取得一项名为“一种可再生能源恒温干燥炉”的专利，授权公告号CN222211167U，申请日期为2024年5月。专利摘要显示，本实用新型公开了一种可再生能源恒温干燥炉，涉及干燥炉领域。

金融界 2024-12-28

解决手机信号不好的实用方法与技巧，提升沟通体验

在现代社会，手机已经成为我们生活中不可或缺的一部分。无论是工作、学习还是休闲，手机都扮演着重要的角色。然而，有时候我们会遇到一个让人十分烦恼的问题——手机信号不好。这种情况下，打电话时听不清对方的声音，发信息也时常失败，简直让人抓狂。那么，遇到手机信号不好的情况该怎么办呢？下面就来分享一些实用的方法，帮助你解决这个烦恼。

新报观察 2024-12-28

江苏华创线缆取得BTTZ防火电缆填充用氧化镁粉干燥装置专利，干燥更均匀效果更好

金融界2024年12月28日消息，国家知识产权局信息显示，江苏华创线缆有限公司取得一项名为“一种BTTZ防火电缆填充用氧化镁粉的干燥装置”的专利，授权公告号CN222211148U，申请日期为2024年4月。

金融界 2024-12-28

阿里达摩院出手，AI终于学会写汉字了

AnyText的应用场景

AnyText的产品特点

推荐体验

相关资讯

阿里达摩院发布遥感AI大模型

Code Llama：Llama 2 学会写代码了！

腾讯憋的AI大招，终于出手了

达摩院获增资阿里版ChatGPT正在研发中

揭秘阿里达摩院类ChatGPT核心团队人才地图

近期资讯

华为手机截屏功能详解：多样化操作与实用技巧分享

曼恩斯特取得单段烘干单元 NMP 回收装置及烘干系统专利，适配性更高

解决电脑数字键盘锁定问题的简单方法与技巧

在OPPO手机上轻松截取长图的详细步骤与注意事项指南

如何删除搜索记录保护隐私：实用方法与技巧汇总

广州天幸机电取得用于PCB板水平电镀循环节水专利，降低水资源损耗

常州吉邦药化机械取得卧式圆盘连续干燥冷却机专利，在机内完成干燥后即可冷却无需额外设备，提高效率节省场地空间

神州心辰取得一种可再生能源恒温干燥炉专利，在利用气流驱动时可减少其他能源消耗

解决手机信号不好的实用方法与技巧，提升沟通体验

江苏华创线缆取得BTTZ防火电缆填充用氧化镁粉干燥装置专利，干燥更均匀效果更好

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响