今年以来,AI生成图像技术的进步,就已经冲出技术圈,成为大众热议话题。所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容、用户产出内容后的新型内容创作方式。不久前各社交平台掀起的“AI绘画”风潮就是AIGC的一个典型案例。
近日,在昆仑万维昆仑天工AIGC技术发布会上,CEO方汉正在展示旗下AI绘画模型“天工巧绘”的成果。天工巧绘来自昆仑万维旗下的“昆仑天工”,这是昆仑万维集团推出的全系列AIGC算法与模型,并宣布模型开源。昆仑天工也是昆仑万维这位互联网巨头储备已久的“技术武器”。
当然,昆仑天工全系列AIGC算法与模型并不是只有天工巧绘SkyPaint,还包括天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,且其在四大模态领域均采用世界顶尖模型。自此,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。
目前,昆仑万维的业务遍布全球一百多个国家和地区。从2009年就开始出海,昆仑万维多年来已经拥有一套成熟的运营体系。日积月累下,从对AI技术的探索,到“文化数据库”的建立,都成为此次发布的“昆仑天工”的铺垫和前奏。
昆仑天工是一个全模态的模型,昆仑万维于2020年底至2021年4月份做了百亿参数的中文GPT-3模型;2021年8月份开始开启虚拟人业务,研发出了基于gpt-3和metahuman的自主驱动高精度虚拟人产品; 2022年1月启动AI音乐实验室,是国内第一款商用级作曲AI模型,2022年9月份启动编程、绘画、文本方向的AIGC产品。
当前,昆仑天工的AI大模型能够拥有多样的任务能力,包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等。当前,在各项专业性领域的任务中,如分类、匹配、填空、识别等,昆仑天工的表现突出,与现有中文大模型的对比,也能够排列前茅。
比如天工巧绘SkyPaint,这是全球第一款多语言stable diffusion分支模型,兼容Stable Diffusion;使用1.5亿中英双语语料,支持中英双语输入实现文字生成图像,是国内为数不多的支持中英双语的文图生成模型,在数量和丰富度上都有较好优势。
图1 天工巧绘SkyPaint作品
AI音乐方面,天工乐府SkyMusic是国内第一款商用级作曲AI模型,该模型引入全局信息约束、和弦隐式表征,和弦准确率达到92.5%,远超目前行业最佳64.7%;支持中文、英文、日文、韩文、法文等31种语种,支持从旋律生成歌词、文案素材生成歌词,且支持全球多曲风。
与之对应的是,天工妙笔SkyText采用生成效果最好的开源GPT中文预训练大模型,针对中文领域构建了千亿级别的高质量数据集,能提供包括续写、对话、中英翻译、内容风格生成、推理、诗词对联等在内的各种功能。
而AI编程方面,天工智码SkyCode则采用全球第一款多语言开源编程大模型,能生成python、Java、C、php、swift等共计十余种编程语言,使不同语言的使用者都能来体验。
如今,昆仑天工作为昆仑万维集团的AI新板块,将成为业务的新增长动力。未来,昆仑万维的全球航程仍在继续。而AIGC将会成为元宇宙的基石和引擎,将为所有玩家打开全新的增量空间。