2023年4月18日,APUS发布自研的千亿参数规模多模态人工智能大模型“AiLMe”,并在近日开放公测。
过去的近10年中,APUS以手机系统和软件出海见长。面对老板这样的要求,一部分员工自然是懵的,他们完全不理解李涛到底要干什么,就像李涛第一次见到OpenAI创始人Sam Altman时,他本人也完全没想到会有一个如此宏大的画卷摆在面前一样。
2019年,沈南鹏率领三思院的一众创业者学员前往硅谷游学,这一行中,李涛、王小川、王兴、张一鸣等新锐企业家都在列,游学的重要行程就是拜访很多硅谷的大佬,如雅虎创始人杨致远、Zoom创始人袁征等,其中的一站,他们见到了Sam Altman。
ChatGPT的问世让李涛有种“后脖颈发凉”的感觉,“惊鸿一瞥”是他当时的感觉。
李涛惊讶地发现,ChatGPT颠覆了以往信息交互的方式,仿佛在跟一个真人在交流,可以连续追问,它用对话机器人的方式不停给你答案,它甚至知道你在想什么。而且,ChatGPT门槛极低,很多人都可以用。这些都给了李涛极强的冲击力。
李涛在公司提出一项明确的要求——全员必须All in人工智能。该要求严格到,连行政人员也必须考虑人工智能如何改进自己的工作。李涛甚至提出要将员工使用人工智能的程度与涨薪挂钩。
APUS的李涛曾经身陷找不到出路的痛苦中,直到ChatGPT的出现才让他找到了一道曙光。在做内容类产品的过程中,APUS完成了人工智能能力第一步的积累,而等到体验过ChatGPT之后,其所展示出的易用性和亲民性,让李涛再次意识到人工智能技术能力在这中间起到的判断和衔接作用。
2022年12月,李涛在公司内部召集了一个大模型团队,并快速立项,将重心全部转移到人工智能和大模型上。他还下了三个结论:第一,通用人工智能时代即将到来,而人工智能时代的操作系统就是大模型;第二,APUS一定要有大模型;第三,必须得是自己做。
APUS的人工智能研究院成立于今年3月,由研究院首席专家张旭负责。张旭本科、硕士、博士均毕业于清华大学,也是此次大模型的主力之一。他告诉《中国企业家》,AiLMe采用目前业内主流的Transformer架构,同时设计了一套“插件式”架构,可以自主学习和使用“工具”,这些“工具”以插件的方式接入到AiLMe平台中。而在文本、图像、视频、音频的生成部分,AiLMe则沿用了目前业内主流的扩散模型(Diffusion Model),并继承了开源社区的生态。
APUS的大模型探索和准备已经开始了, AiLMe是一项重要的成果。它是一款千亿参数规模多模态人工智能大模型,可以自主学习和使用“工具”,并以插件的方式接入到平台中。它采用了目前业内主流的Transformer架构和扩散模型,可以生成文本、图像、视频、音频等多种内容。
大模型训练需要大量的算力、数据和场景支持。APUS公司推出了千亿参数规模的 AiLMe 大模型,并提出了影响大模型质量的四个要素:算法、算力、数据和场景。对于大模型效果的因素,APUS 认为重要性排序应该是:训练数据质量>训练数据规模>参数规模。
为了解决算力问题,APUS 在郑州和新加坡分别建设了两大智算中心,并在自建 GPU 服务器算力的基础上,与腾讯、阿里、亚马逊等服务商进行租用和采购,与第三方的算力协同作用。
在数据方面,APUS 大模型的数据来源有四个:公开的行业数据、互联网的公开数据、专门用于训练人工智能的数据集、真实的用户需求数据。其中,真实的用户需求数据的权重非常高,因为每天有上百万人在使用产品时产生数据和互动。
APUS 从 AiLMe 大模型内蒸馏出文本、图像、视频、音频四个垂直领域精炼模型,并基于此开发出直接面向用户的智能问答大师、简笔成画、墨染、Star Night、KJV Bible Now、PicPik 等 AI 产品。
对于具体场景的应用,APUS 也有自己的探索和实践。例如,旗下的“智能问答大师”产品每天会收到几十万的用户问题,这些都可以用来训练数据和模型。
在李涛看来,ChatGPT 的震撼一半归功于 OpenAI 团队,另外一半得归功于全球的用户,因为是全球的用户打开了 ChatGPT 的想象空间,开启了思维模式。相比大家对算力的焦虑,李涛更看重高质量的数据。
“这通常是真实用户的真实需求和问题,我们都脱敏过,不会涉及数据隐私安全,更关注用户的问题和需求,至于你是谁并不重要。”李涛解释道。
APUS公司正在探索基于大模型的AI技术在商业领域的应用。该公司采用短期to C、中长期to B的模式,以提供高品质和实时的数据,并将其运用到不同的行业场景中。李涛认为,中长期的商业模式一定是to B,因为一家公司所能覆盖的场景是有限的,需要更多的行业伙伴共同建构。未来,大模型技术将无处不在,所有的服务都将使用它,市场规模将达到10万亿美元以上。
与此相似的是,李涛预测,未来许多行业服务都将通过在大模型基础上蒸馏出的精炼模型来支撑,而不是用大模型全局支撑,因为这样成本太高了。一个大模型会蒸馏出若干个经验模型,用来支持不同的服务。
APUS公司的员工们正在逐渐接受并采用AI工具。李涛提出了一项激励计划,如果员工能够借助AI提高效率30%,则加薪10%;如果提高效率50%,则加薪20%;如果提高效率50%以上,则加薪30%。企业内部正在分成三批人:一批人专注于做大模型;一批人专注于将大模型应用到C端产品上;另一批人是职能部门的员工,他们可以采用任何AI产品。这种隐形压力也促使员工们不断提升自己,推动公司不断向前发展。
李涛认为,通用AI大模型将成为未来20年的主流,这是一场全新的技术革命。他表示,做企业的人要时刻捕捉这个时代的潮流。过往的经验告诉李涛,任何技术变革前期都是巨大红利期,也是对社会创造价值最多的时间窗口。因此,他将继续探索大模型技术在商业领域的应用,为社会创造更多的价值。