机器之心报道
作者:陈萍
邮政之父罗兰・希尔爵士的便士邮政法,引发了一场关于世界邮政的重要革新,同时也促进了世界上第一枚邮票「黑便士」的问世,这一年是 1840 年。之后,在这不到两百年的时间里,随着社会的发展,有些邮票退出了历史舞台,成为邮票收藏爱好者的珍品;而新的邮票被不断推出,广受大家追捧。
邮票不仅是书信和包裹传递的必备工具,小小纸片上承载的是历史,也是文化,具有很高的欣赏和收藏价值。一枚邮票在方寸之间将一个国家或地区的科技、人文、自然风貌等特色集于一身,这些信息有助于人们了解世界各地的文化遗产和历史事件。
很多人将邮票赞誉为国家名片、世界窗口、微型博物馆,这并不是说说而已。历史上发行的很多邮票,都被用来记录一些重大历史事件。比如 2022 年北京冬奥会,联合国通过发行主题为「体育促进和平」的邮票来纪念这一大型体育盛会。
在备受瞩目的杭州第 19 届亚运会上,杭州亚运会官方合作伙伴阿里云联合中国邮政将 AIGC(生成式人工智能)技术带到了邮票和明信片上,他们共同推出了杭州地标个性化实体邮票「智涌亚运・AIGC 杭州地标」以及「亚运 AIGC 个性化智能邮筒」,不仅如此,这是首套由人工智能大模型辅助生成的 AIGC 个性化邮票。
而这背后,起到关键作用的便是阿里云通义大模型家族的 AI 绘画创作大模型「通义万相」,随着邮票的发行,也意味着,阿里云大模型在应用落地方面又迈入了一个全新的领域。
杭州邮政集邮与文化传媒部总经理叶冬梅以及阿里云通义万相高级产品专家付非凡为我们揭秘了幕后合作理念:
https://weibo.com/tv/show/1034:4948110074380333?from=old_pc_videoshow
小邮票见证大历史,方寸之间擦出科技火花
近 10 个月以来,随着国内外大模型陆续发布,AI 领域仿佛迈入了一个新的赛道,这些大模型不仅在自然语言处理方面表现出色,有些甚至在绘画领域也展现出了令人深刻的印象。用户只需输入一句提示,片刻之间,一张堪称经典的大作就呈现在你的眼前,可谓是精准拿捏每一位用户的喜好。
此次,阿里云别具一格的将 AIGC 的技术运用到邮品上,为杭州亚运增添了许多智能的体验。
邮品被封装在封套里面,封套简单大气,配色和谐,最上方印有杭州亚运会会徽、官方合作伙伴阿里云,底部为「智涌亚运・AIGC 杭州地标」以及虚实结合的杭州奥体中心体育场(又名大莲花)。
拆开封套,「智涌亚运・AIGC 杭州地标」的神秘面纱就被揭开了:
首先是邮票,本次双方合作的邮票被命名为「智涌亚运・AIGC 杭州地标」,虽然只有短短几个字,却足以传达出这套邮票是一次技术与文化的碰撞,更加贴合智能亚运这一办赛理念。邮票下方还有互动二维码,喜欢的朋友可以扫码自行创作。
该套邮票共有 6 枚,对应杭州 6 个地标建筑,它们分别是杭州奥体中心体育场、云栖小镇、杭州世纪中心、杭州西站、钱江新城以及西溪国家湿地公园。
借助 AIGC 技术,制作一张属于自己的邮票变得如此简单,我们也不得不感慨,阿里云和中国邮政真真切切的让创作这件事变简单了。
真实建筑与未来城市图景相互碰撞,共同组成科技感满满的个性化邮票。
细心的网友可能已经发现了端倪,每一枚邮票的设计都很独特,似乎和以前见过的邮票大不相同。细细查看才发现,原来奥妙都藏在邮票的设计风格上。它们采用虚实结合、左右拼贴的方式设计而成,左侧为杭州真实地标性建筑;右侧则是阿里云通义万相辅助生成的杭州地标未来城市图景。这一设计风格更加体现了智能涌动、精彩纷呈、充满活力的杭州。
杭州奥体中心体育场。
6 枚邮票都非常精美,给人一种耳目一新的感觉,更何况还有着如此重要的纪念意义。
单就杭州世纪中心这枚邮票来说,邮票左上角注明了地标名称,右下角为技术支持方即阿里云通义万相。整张邮票真实建筑与未来城市图景交相辉映,组合的恰到好处。
杭州世纪中心。
邮票虚实部分的拼接严丝合缝,俨然一个整体。与真实地标相比,AIGC 的部分更具未来感,画面也更加吸引人,未来的双塔大楼在阳光的照射下呈现出令人惊叹的美丽景象,远处可见一系列更加先进的办公大楼和标志性建筑物,它们一同构成了未来杭州面貌。
其实,古今中外,人类一直在畅想未来城市的样子,或是科技感满满,又或者是赛博朋克…… 现在随着技术的发展,在人工智能的加持下,曾经只能在脑海中想象的未来城市已经被 AI 描绘出来了。
除了杭州奥体中心体育场和杭州世纪中心这两枚邮票外,接下来我们在欣赏一下其余 4 枚放大版并且科技感爆棚的邮票:从上到下分别为云栖小镇、杭州西站、钱江新城以及西溪国家湿地公园。
其实,细数下来,国内外发行关于综合性运动会邮票的作品已经数不胜数,但发行基于 AIGC 创作的个性化邮票这还是头一次,我们可预见这套邮票的特别之处和纪念价值。
除了 AIGC 个性化邮票,阿里云和中国邮政还联合发布了「亚运 AIGC 个性化智能邮筒」,同样的,该邮筒也接入了阿里云通义万相大模型。用户通过互动点击或者输入关键词,就能生成创作,然后通过扫码打印在明信片上就可以了。
这样一来,一张专属于自己的明信片轻轻松松地就制作完成了。其实,喜欢旅行的小伙伴可能都有这样的习惯,每到一个新的地方,会向远方的朋友邮寄一张,以表达自己美好的祝愿。虽然只是只言片语,但其传递感情的方式比发一条短信、打一个电话更加有趣。
在杭州亚运会这个如此重大的日子里,邮寄一张明信片给家人、朋友,和他们一起分享这个令人难忘的时刻是非常有意义的。况且这张明信片还不同于以往,首先它是专为杭州亚运会设计的,其次,明信片上采用了 AIGC 技术。
「亚运AIGC个性化智能邮筒」前面聚集了很多前来体验的人。
给邮品注入科技基因,阿里云有「独家秘笈」
了解完专为杭州亚运会打造的 AIGC 个性化邮票、AIGC 智能邮筒后,隐藏在你体内的 DNA 是不是疯狂跳动,也想设计一款属于自己的未来城市大作。先别着急,这还要从如何使用通义万相生成图像说起。
目前,通义万相上线了文本生成图像、相似图像生成和图像风格迁移三大功能。大家可以组合使用这些功能,从而完成精美的图像创作。
体验地址:https://wanxiang.aliyun.com/creation
具体而言,作为最基本的文本生成图像功能,你要做的就是输入文本提示(500 字以内),然后选定风格(水彩、油画、中国画、扁平插画、二次元、素描等),最后点击生成就可以了。此外,通义万相还贴心的内置了三种生成图像比例,即 1:1、16:9 和 9:16 。
接下来是相似图像生成功能,即用户输入一张参考图像,借助通义万相,就可以生成很多张风格、内容相似的图像。在这一功能下,用户上传的图片大小不要超过 10M ,格式为 JPG、JPEG、PNG、BMP 等。
最后是风格迁移功能,需要用户输入原图和想要的风格图,输入图片的大小和格式与图像生成功能相同。
基本操作流程了解完后,接下来,我们亲自上手体验了一番,这里我们测试了相似图像生成以及风格迁移这两项功能。
首先是相似图像生成。我们上传了一张西溪国家湿地公园的真实照片,然后点击生成相似画作,一眨眼的功夫,几张足以以假乱真的图像便展现在你的眼前,如果不细细查看,很容易产生这就是西溪国家湿地公园真实面貌的错觉,因为新生成图片的建筑风格及特点,以及周围环境都和原始照片太相似了,这也说明了通义万相相似图像生成这一功能非常出色:
如果你希望新生成的图像和原始图像是不同的风格,这时风格迁移功能就派上用场了。例如,我们上传一张大莲花真实图片,接着在上传期望的风格图进行引导,一眨眼功夫,具有不同风格的照片就生成了,每一张都非常精美。
简笔画风格的大莲花。
具有未来科幻城市风格的大莲花。
一番体验下来,我们可以得出,借助通义万相,用户可以快速批量生成不同的素材,从而为创作者带来新的灵感,挖掘新的创意。
毫不夸张的说,之后,无论你是想表达想法、展示创意,还是寻找灵感,有通义万相就足够了。
事实上,通义万相能够拥有如此强大的能力,背后的杀手锏便是阿里云自研的基于知识表示重组的图像生成大模型 Composer。相关论文《Composer: Creative and Controllable Image Synthesis with Composable Conditions》已被国际 AI 顶会 ICML 2023 收录。
与 Stable Diffusion 原理不同的是,阿里云构建的 Composer 模型框架运用了「拆解 - 组合」的思想。
所谓「拆解 - 组合」,即在训练过程中,阿里云会对图像中的物体蒙版、颜色、深度图、线条等信息进行拆分。然后在推理阶段将这些设计元素重新组合成新的图像,执行过程中还能对这些元素进行修改和编辑。
这就出现了一种呈指数级的组合爆炸现象,举例来说,假设有 100 张图片,每张图片可以拆分成 8 种元素,最后就能得到 100^8 种组合结果,效果还是很惊人的。
如此一来,模型在训练阶段就获取了更多的细节和语义信息,因而在生成环节,可以对图片进行更精细的控制和组合性的创作。
拆解 - 组合图像生成过程。
正是基于 Composer 框架,我们才能体验到通义万相带来的相似图生成和风格迁移这两种图生图功能。
AI 研发就像烧一壶开水,比 100℃更难的是从 0℃到 99℃,需要在技术上进行持续创新。
阿里云能够拥有今天的成绩,并不是一蹴而就的,而是建立在早年的技术积累之上,才有了今天的厚积薄发。作为全球领先的云计算及人工智能科技公司,阿里云早在 2018 年就开启了 AI 大模型技术的研发。
2022 年阿里云正式对外推出了「通义大模型系列」,覆盖语言、语音、图像等领域,在业界首次实现了模态表示、任务表示、模型结构的统一,处于国内领先梯队。
为了更好的促进大模型生态的繁荣,阿里云更是业界第一个提出模型即服务「Model as a Service」MaaS 的云厂商。
今年 4 月 11 日,阿里云对外推出了「通义千问」大语言模型,当时在这一赛道上,能够训练出大型语言模型的公司屈指可数,阿里云算是走在了前列。
7 月 8 日,继发布大语言模型通义千问三个月后,阿里云又推出了 AI 绘画创作大模型「通义万相」,也就是「智涌亚运・AIGC 杭州地标」邮票背后的技术支撑,这也是阿里云在执行技术落地方面交出的另一份答卷。
9 月 13 日,通义千问已首批通过备案,向全社会开放。
一系列成果接连不断的出现,在 AI 大模型这条赛道上,百模大战已经拉开了序幕,而阿里云早已做好了准备。
科技感遇上文艺范,助力杭州亚运会
本届杭州亚运会办赛理念之一便是「智能」亚运,谁也没想到小小一枚邮票在亚运会上竟然成了「显眼包」。作为杭州第 19 届亚运会官方合作伙伴,阿里云将最前沿的 AIGC 技术用到邮票设计上,这一大胆而新奇的创意,杭州亚运会算是首创,很有杭州范。
不仅如此,以前只能由名人大咖来参与设计的邮票,现在也进入了寻常百姓家,人人都可以创作属于自己的邮票,即使你不会画图、不会设计,也不用担心,你要做的只是输入简短的提示语,剩下的交给 AI 就可以了。
这样一来,会有一大波年轻人参与进来,亲自体验制作邮票的乐趣。
对于杭州而言,杭州亚运会的举办将这座美丽的城市推向了世界的舞台,而 AIGC 个性化邮票则成为了这一历史盛事的永恒见证。6 枚邮票代表了杭州 6 座地标建筑,而这六座地标建筑如同数据中心的存储单元,承载着杭州的现在和未来。
每一枚邮票,都是一幅数字时代的精美绘画,捕捉着杭州的每一个细微之处。这不仅仅是邮票,更是科技与艺术的结合,是关于杭州的一幅生动画卷。
此外,邮票不仅仅是一张普通的邮资工具,更是一件珍贵的收藏品。它将成为邮票收藏家和旅游爱好者的珍宝,因为它承载着一段特殊时刻的回忆。
随着这些邮票的传播,它们将化身为一扇城市的大门,一份关于杭州的邀请函,吸引来自世界各地的人们,探索这座充满活力和机遇的城市。
大模型的潮流,浩浩荡荡,如一股技术和创新的洪流,正在重新定义着我们对 AI 的认知。
对于阿里云来说,他们不会止步于此,将继续投资于研发和创新,不断提升大模型的性能和应用,以满足不断增长的市场需求。
近期,通义万相还将推出更多令人惊喜的功能和应用。其中之一便是涂鸦作画功能,用户只需轻松绘制一张草图,再加上关键词,即可瞬间创造出精美的图画。
未来,阿里云将继续引领大模型的发展趋势,推动创新,为更多像中国邮政这样的企业客户和普通消费者提供卓越的人工智能解决方案,助力他们在数字化时代取得更大的成功。可以预见,大模型必将继续引领人工智能的发展浪潮,而阿里云将坚定不移地站在前沿,为这一未来做出积极的贡献。