正是长期坚定AI赛道,坚定布局、踏实前进、长期主义,让科大讯飞可以快速打造出技术实力领先的国产大模型,也让科大讯飞最有希望在中国率先实现智慧涌现。
作者/文林
出品/新摘商业评论
自去年11月底,OpenAI公司发布ChatGPT之后,短短两个月的时间里,全球活跃用户数超过一个亿。
通过对海量数据的高质量清洗和对上亿参数大模型的学习与训练,ChatGPT实现了在文本生成、语言理解、基于思维链的逻辑推理以及数学能力、代码能力等多个领域的智慧涌现,并表现出极强的进化能力:今年2月ChatGPT发布了全新的版本升级,3月15日又推出了GPT-4。
可以说,ChatGPT的横空出世不仅刷新了普罗大众对人工智能的认知,也让认知大模型技术在全球引起了新的浪潮。
“传统意义上通过堆时长、堆人力的商业模式将被根本性地颠覆,因此有人说,这一次人工智能在历史上的意义不亚于PC和互联网的诞生,我觉得这是完全恰当的一种表述。”科大讯飞董事长刘庆峰说道。
在5月6日科大讯飞举行的讯飞“星火”认知大模型成果发布会上,科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪正式发布讯飞“星火”认知大模型,并带来了丰富的应用成果。自此,中国生成式AI市场再添一位猛将,大厂比拼AI大 模型,而科大讯飞为何能够先行一步。
一、十年积累,智能技术攻关与储备
1999年,中文语音市场由国际巨头把持,还在中国科学技术大学就读的刘庆峰怀揣着“中文语音技术必须由中国人做到全球最好,中文语音产业必须掌握在自己手上”的信念,毅然创立了科大讯飞。
10 年后,连续在国际语种识别评测大赛中名列前茅的科大讯飞,在深圳证券交易所挂牌上 市,成为中国在校大学生创业的第一家上市公司。
在语音技术与产业确立了领导地位之后,随着人工智能时代的来临,科大讯飞又迎来了一个新的发展拐点。
“科大讯飞是中国的国家队,在2014年我们就推出了‘讯飞超脑计划’,明确提出要让机器像人一样具备能理解会思考的能力。”刘庆峰在发布会上说道。
彼时,人工智能的突破与认知智能紧密相关,而认知智能的关键是让机器能理解会思考,这必须要突破语言理解、知识表示、联想推理,自主学习等多个方面。
为更好地探索和实践认知智能,美国、欧盟等发达国家分别提出了“Brain Initiative”和“Human Brain Project”等人脑研究计划,投入巨资并将其提升到与“人类基因图谱”重大工程并重的高度。苹果、谷歌等国际IT产业巨头也相继推出了Siri、Google Now语音搜索等一系列人工智能应用。
正是在这样的背景下,讯飞发布讯飞语音云3.0、灵犀3.0,正式启动“讯飞超脑计划”,进行认知智能技术攻关和储备,核心就是让机器从“能听会说”到“能理解会思考”。
自此之后,科大讯飞一路“飞奔”:2015年,发布了对人工智能产业具有里程碑意义的人机交互界面——AIUI;2017年,承建认知智能国家重点实验室;2022年,发布“讯飞超脑2030计划”,要让人工智能“懂知识、善学习、能进化” ,让机器人走进每一个家庭。
“在国家平台和讯飞超脑计划的支撑下,过去几年我们在认知智能领域取得了一系列全球领先的成果。”
仅2022年一年,科大讯飞就在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军。其中13项涉及常识阅读理解挑战赛OpenBookQA、QASC、ReClor等专业领域知名竞赛。
例 如,依托科大讯飞建设的认知智能国家重点实验室的相关团队:
在常识推理挑战赛CommonsenseQA 2.0中刷新机器常识推理水平世界纪录;
在科学常识推理挑战赛OpenBookQA中以准确率94.2%的绝对优势夺冠;
在常识推理挑战赛QASC中以多模型准确率93.48%、单模型准确率92.07%夺冠,后两项比赛更是超越人类平均水平。
(QASC挑战赛最新榜单)
可以说,科大讯飞的“讯飞超脑计划”,既是实现包括感知智能和认知智能在内的全面突破,也是其在人工智能领域的核心布局内容。
目前,科大讯飞在教育、办公、医疗等多个领域都有专有认知模型。以医疗领域为例,作为国内唯一通过国家执业医师资格考试的AI系统,测试成绩超过96.3%的医学考生,科大讯飞已累计为基层医生提供超过5.8亿次、日均超70多万人次的AI辅诊。积累了刚需行业数据之后,专有模型反哺通用大模型的发 展,将更快促进其智慧涌现。
据刘庆峰透露,在2022年12月15日,科大讯飞 正式启动“1+N”认知智能大模型的专项攻关。其中,“1”为通用的认知智能的大模型,“N”是把大模型在各个领域的落地,包括教育、办公、汽车、人机交互以及医疗等众多领域。这也是科大讯飞此次发布通用模型和行业产品的一个非常重要的试点。
二、坚定AI赛道,铸就大模型七大核心能力
如果说多年来对人工智能核心技术的不断积累、突破,以及对未来发展方向的准确预测,让科大讯飞获得了进入大模型时代的“入场券”,那么海量的文本、代码和知识数据,则为科大讯飞能够快速打造出行业引领的AI大模型提供了强有力的支撑。
作为国内领先的人工智能企业,科大讯飞不但拥有丰富的技术积累和经验,还建设了目前业界一流的AI数据中心,尤其在中文文本数据以及多语种等方面有着独有优势。
要知道,讯飞人工智能开放平台作为首批国家新一代人工智能开放创新平台,日使用量超过50亿人次,天然可为大模型投喂海量文本语料和用户反馈数据;而多语种翻译技术又是讯飞多年深耕的领域,链接了全球各语种各行业的知识。这些都为训练讯飞星火认知大模型,帮助其实现更自然、更智能的对话交互,提供了极大地助力。
而当多种类型的数据送到一个统一的认知智能的大模型中去学习和训练,最终可以在通 用领域呈现出让人惊喜的表现。
“通过这样一个统一的单模型学习之后,我们就会发现我们的系统会具备了像人类一样的触类旁通,在多领域的智慧涌现的令人惊喜的表现。”刘庆峰说道。
于是我们看到,在发布会现场,科大讯飞围绕讯飞星火认知大模型的文本生成、语言理解、知识问答、逻辑推理、数学能力、编程代码能力、多模态七大核心能力,进行真机实测,现场效果惊艳。
像是基础的问答、长文本生产、数学计算,“星火”都能轻松作答。对于模棱两可的汉语提 问,“星火”也能出色应对:
对英文语法纠错,也是 信手拈来:
“科大讯飞在国内目前已推出的认知大模型中,明显是领先的。英文如果满分以5分来算,ChatGPT现在是4.48分,而我们已经达到4.29分。”刘庆峰补充道。
在知识问答部分,刘庆峰还特别强调,“星火”拥有讯飞医疗专业系统中的一部分通用能力,在医疗能力上比ChatGPT、GPT4都要强。未来,讯飞还会将与医疗机构合作中获得的医疗专业知识逐步放到这一通用大模型中,专业的医疗领域的模型将 在今年的10月24日正式推出。
现场还随机抽取了弹幕问题进行实测。比如,“外星人感冒需要戴口罩吗?”、“40平米的房子装成70平米的可行方案?”、“跟女朋友吵架了有什么办法 解决?”......
因大家的参与热情过高,原计划1个半小时的实测延迟到了2个小时,现场观众仍是意犹未尽。
不过,发布会上的 展示或只是“开胃前菜”。在接下里的一段时间里,讯飞星火大模型将在:
6月9日前, 开启实时问答,升级多轮对话能力 ;
8月15日前,再次提升代码能力以及多模态交互能力;
10月24日前,通用模型在中文能力上超过ChatGPT,在英文能力上与ChatGPT相当。
可以看出坚定AI赛道的科大讯飞,在整个规划和安排上明显更自信,更自如。
三、长期主义,引领中国智慧涌现
可能单看讯飞星火认知大模型的发布会,不少人已觉得颇为惊喜。但事实上,星火认知大模型的发布,只不过是科大讯飞“超脑”征程中的一步棋。
2022年伊始,科大讯飞发布了“讯飞超脑2030计划”。计划的核心是以价值创造为根本,通过AI技术持续的核心源头技术创新和系统性创新,让机器远不止具备“你问我答”的基础智能,还拥有更强的交互、运动能力,以解决未来社会重大刚需命题。
同时,科大讯飞 将“讯飞超脑2030计划”分为三个阶段:
阶段一:2022-2023年,目标为从医疗、教学、健康等方面底层的技术出发,完成软硬一体机器人和数字虚拟人的制造,让数字虚拟人在数字经济、虚拟世界真正地帮助人类;
阶段二:2023-2025年,目标为进一步发展到自适应行走的外骨骼机器人,能够让外骨骼机器人真正进入到生活之中;
阶段三:2025-2030年,目标为打造懂知识会学习的陪伴机器人、自主学习的虚拟人,让人工智能拥有交互能力、动作能力。
可以看出,科大讯飞希望从软硬件两端都完成机器人布局。其中,软件端是虚拟人,硬件端则是陪伴机器人。
于是我们看到,在去年全球1024开发者节上,科大讯飞展示了机器狗、仿人型机器人等多种实体形态的机器人。基于科大讯飞超脑平台,机器人能够具备多模感知AI能力,未来还可以持续提升自主进化学习能力。
与此同时,科大讯飞的虚拟人交互平台建设了虚拟助理、虚拟服务机器人、虚拟电商主播、虚拟导游、虚拟IP等数百个形象和声音,为各类客户提供虚拟人解决方案。
目前,科大讯飞AI虚拟人智能交互一体机产 品已经深度触达金融、政务、文旅等多个场景。接入星火认知大模型能力之后,虚拟人可以调用更多能力,支持多轮对话,服 务也更加细化。
总之,星火认知大模型是“讯飞超脑2030计划”的重要阶段,其最终目标是打造出懂知识、会学习的陪伴机器人和自主学习的虚拟人家族,进入千家万户,解决中国老年社会的问题。
而此前国务院出台的《新一代人工智能发展规划》曾提出,“到2025年,中国人工智能核心产业规模超过4000亿元,带动相关产业规模超过5万亿元;到2030年,使中国成为世界主要人工智能创新中心”。
作为在人工智能领域的深耕者,科大讯飞耐得住寂寞也守得住繁华。如今,“讯飞超脑2030计划”才行至第一阶段,随着“十四五”规划将人工智能列为前沿科技领域的“最高优先级”,未来等待着科大讯飞的将是更为广阔的成长空间与发展红利。
十年磨一剑,出鞘试锋芒。 将星火大模型放进科大讯飞的发展过程中来看,仅仅是其人工智能历程、讯飞超脑计划中的一个阶段。而始终坚持长期主义,让科大讯飞得以快速打造出技术实力领先的国产大模型,也让其有望在中国率先实现智慧涌现。