编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。
2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。
时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。
21世纪经济报道记者白杨 北京报道
在新的AI浪潮下,一场围绕AI而展开的全球军备竞赛也拉开了序幕。眼下,虽然是ChatGPT独领风骚,但它其实仅是冰山一角,接下来,基于大模型而产生的AI应用将不断涌现,就像十年前移动互联网来临那样,一个新的变革时代正悄然而至。
面对时代性机遇,总会让人兴奋不已,国内外的科技巨头更是摩拳擦掌,蓄势待发。澜舟科技创始人兼CEO周明近日在接受21世纪经济报道采访时表示,中国企业做大模型,一方面不能固步自封,要虚心跟别人学习,另一方面,也不要太过于长他人志气灭自家威风,因为过去二十几年,中国已经取得长足的进步,在AI领域也能够走出中国特色。
周明举例说,“比如把大模型的每个功能都做得更加可控,或者在To B落地方面走在前面,这些都会成为中国特色,有了这些东西就可以形成武林中的‘中国派’,也能够让同行们看到中国力量”。
实际上,过去十年,整个AI产业都处于快速发展期,很多中国企业也投入巨大资源去深耕该领域,这也使得中国在部分AI细分领域,实现了全球领先。在诸多中国科技企业中,腾讯对AI的布局较早,并在AI应用上有着丰富的实践,所以本文将以腾讯为样本,希望通过观察它的AI发展之路,能给行业未来发展带来一些启迪。
十六年前的布局
中国的AI,最初都是围绕产品的需求而出现。比如腾讯AI的起点,是在2007年,那一年,腾讯投入亿级资金筹建了腾讯研究院。
现任腾讯云副总裁、腾讯云智能研发负责人的吴永坚,2008年入职腾讯的第一个部门就是腾讯研究院。他告诉21世纪经济报道记者,腾讯研究院的研究一开始很偏应用,比如他当时做的一项工作,就是围绕QQ影像进行图像处理技术的研发。
“后来借助我们的技术,QQ影像的处理时间降低到原先的60%左右,效果非常明显,然后这项技术被应用到游戏等其他部门”,吴永坚说,也是从那时候开始,腾讯研究院发现自己做技术储备更合适,于是整个团队开始转型,从偏产品的团队转向了技术支撑团队。
随后,腾讯研究院在模式识别、多媒体通信、数据挖掘、图像处理、分词等方面取得了诸多成果。到2011年,腾讯申请专利超过4000件,这一数字也超过了国内其他互联网企业总和,其中腾讯研究院的贡献超过一半。
起源于腾讯研究院,吴运声、吴永坚等人后来组成了优图实验室团队,成为业界顶级的计算机视觉实验室。后来,腾讯还陆续成立了多个技术研究团队,比如2011年成立的,主要开发语音人工智能技术的微信智聆语音团队等。
如果说在2012年之前,腾讯的技术研发团队还更多是为了服务自身业务,那从2016年AI Lab成立以后,腾讯便开始了基础研究和产业实践的“两条腿”走路。所以,腾讯的AI路径是从服务业务不断向上游的前沿技术研究延伸。
2019年,在当年举办的世界人工智能大会上,腾讯公司董事会主席兼CEO马化腾对外表示,腾讯已建立四大AI实验室,涵盖AI从全面基础研究到多种应用开发,同时还建立了前沿科技探索的实验室矩阵,涵盖机器人、量子计算、5G、边缘计算、IoT物联网等。
数据显示,2019年,腾讯在全球主要国家的专利申请数量已超过30000件,已授权专利数量超过10000件。当时这一数量在国内互联网公司中排名第一,在全球互联网公司中排名第二,仅次于谷歌。
探索前沿科技
在腾讯的实验室矩阵中,有很多看似“不务正业”的研究,这实际上正是腾讯针对未来基础技术展开的研究。
比如很多人都知道2016年,谷歌旗下的AlphaGo打败了人类围棋冠军,实际上,腾讯AI Lab旗下的围棋AI“绝艺”在2016年面世后,也先后四次夺得世界顶级赛事冠军,并自 2018 年起开始无偿担任中国国家围棋队训练专用AI。
再比如2017年,腾讯将人工智能技术运用到了医学领域,发布了可以辅助医生进行医学影像筛查以及医学诊断的AI产品“腾讯觅影”。 2017年11月,科技部宣布了首批国家新一代人工智能开放创新平台名单,其中就包括依托腾讯公司建设医疗影像国家新一代人工智能开放创新平台。
2021年,腾讯对外发布了首个软硬件全自研的多模态四足机器人Max。当时,Max依托足轮融合一体式设计,实现了从四足到双足的站立、移动,并且能完成后空翻、摔倒自恢复等动作。
Max诞生自腾讯Robotics X实验室,这个2018年成立的实验室,核心研究方向就是机器人,具体包括作为机器人基础技术的感知能力,以及灵敏运动、灵巧操控、智能体三大支柱技术。目前,除了Max外,该实验室还发布过机器狗Jamoca和轮腿式机器人Ollie等产品。
除此之外,针对近期备受关注的AI大模型,腾讯也早有布局。去年4月,腾讯便首次对外披露了旗下“混元”AI大模型的研发进展。据悉,混元AI大模型完整覆盖了NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业模型,近年来,该模型已先后在中文语言理解权威评测集合CLUE 与 VCR、MSR-VTT、MSVD等多个权威多模态数据集榜单中登顶。
近期,混元AI大模型团队还推出了NLP万亿大模型,它不但再次打破CLUE三大榜单记录,而且得益于低成本、普惠等特点,该模型也已成功落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
腾讯混元AI大模型团队表示,由于更大的神经网络模型往往意味着更强的模型性能,所以混元NLP大模型未来一方面会着力于探索更大的模型参数规模,另一方面也会结合音频、图像、视频等多模态信息,进一步打造更强大的多模态AI大模型。另外随着AIGC方向的火热兴起,未来混元AI大模型也会不断推进在文本内容生成、文生图等领域的持续升级。
注重场景应用
在基础研究的另一侧,是产业实践。马化腾曾多次表示:“腾讯AI布局注重场景应用,而不是为了研究而研究。”
就像早期,腾讯AI是从用户场景出发,通过AI技术解决内部产品需求,到了中期,是以研究+场景推动通用人工智能发展,强调的是“学术有影响,工业有产出”。而现在,腾讯在用AI解决垂直产业场景难题,将定制化解决方案孵化为标准化AI平台型工具。
一位腾讯人士表示,腾讯AI团队跟传统的研究团队不一样,是一个体系化建设,从算法、工程、质量、数据、产品、到整个商业化模式,有可能有先有后,比如研究最先走,商业化最后进来,但是整体是一辆车往前搭建着走。
吴永坚则提出,“目标如果足够难,场景如果足够复杂,就会牵引着我们做出来一个世界级的算法。同理,当你的算法研究解决的是一个世界级的问题,算法才更有价值,而不是纯粹的为了发paper”。
为了加速推进AI技术的产业落地,2021年11月,腾讯正式发布了“腾讯云智能”品牌,通过聚合腾讯优图实验室、腾讯AI Lab等AI实验室的产品和技术能力以及多年的产业实践经验,对外输出从底层算力支撑到AI开发平台、AI 产品解决方案以及顶层数智化转型方法的全链条服务。
比如在底层算力层面,腾讯以“一云多芯”为基础,借助自研AI芯片加速算力效能;在AI开发层面,腾讯以“腾讯云TI 平台”为核心,帮助客户快速创建和部署AI应用。
紫霄是腾讯面向AI推理场景的自研芯片,目前已经与腾讯云TI平台完成适配,并使单卡性能提升了200%,单位算力优化成本降低50%,绿色算力能耗节约了60%。腾讯云异构计算产品负责人宋丹丹告诉21世纪经济报道,这些芯片会先在腾讯自研业务上部署,未来还希望它能以PaaS服务的形式对外服务。
围绕TI 平台,腾讯也已构建出一个产品矩阵,包括TI-DataTruth标注平台、TI-ONE训练平台、TI-Matrix应用平台、TI-ACC加速工具,在细分领域还包括TI-OCR训练平台、TI-AOI工业质检训练平台等。这些产品也已在泛互、金融、工业、传媒、泛政务、医疗等行业落地应用,帮助实现了智能工业质检、金融AI中台、智慧化城市运营管理、疾病辅助诊断等诸多细分领域AI应用的开发。
腾讯云副总裁, 腾讯云智能平台负责人李学朝告诉21世纪经济报道,现在整个AI在落地方面,确实已走入深水区。“过去,客户只需要你提供一些AI能力就觉得可以了,但现在,客户提出的都是场景应用,需要你把AI融入到业务场景当中”。
在李学朝看来,通过现在火热的“预训练大模型+下游任务微调”的模式,一定会让AI应用变得更加通用化,在此基础上,原有的AI应用场景会做得更深,同时,AI也会渗透到更多场景当中去。
不过其也指出,做AI应用是以解决问题为优先的,所以现在很多场景,用原来的AI模型能解决问题,就没必要去追赶热度,毕竟采用大模型对客户来说也会带来额外的成本。但是对于一些场景,比如智能客服,借助大模型能带来直接的效果提升的,则可以在权衡好性价比的情况下,去进行尝试。
在这场全球范围的AI竞赛中,最前沿的技术研究,我们需要关注、比拼,同时,更需要根据市场条件去做些脚踏实地的事情。周明向21世纪经济报道表示,中国的To B企业服务跟国外很不一样,国外的SaaS生态很成熟,中小企业都已经习惯通过SaaS接受服务,但中国很多企业不接受SaaS形式,还要做本地部署。
这就意味着,在服务To B客户时要花更多功夫,比如要了解客户需求,要做好“最后一公里”的业务流程及系统衔接,另外还要考虑交付和维护成本。“如果你的模型很脆弱,那可能做一个项目就赔一个项目,因此必须把底座做好,也必须了解客户并有快速迭代的能力。这都是中国企业做所谓大模型时必须面对的现实,从这个角度来说,如果只想着快速复制一个ChatGPT然后就可以挣快钱的想法,就非常幼稚了”,周明说。