当前位置:首页|资讯|科大讯飞|华为|ChatGPT

“千模大战”下,中国最需要什么样的大模型?

作者:AI财经社发布时间:2023-10-31

原标题:“千模大战”下,中国最需要什么样的大模型?

国产大模型攻关又跨越出了关键的一步。

10月24日,一年一度的科技行业盛事科大讯飞全球1024开发者节在合肥如期举办。在开幕式上,科大讯飞重磅发布讯飞星火认知大模型V3.0。

相比此前版本,讯飞星火大模型V3.0的七大维度能力进一步全面提升:重磅升级了大模型代码能力,实现全面对标ChatGPT(基于GPT-3.5),医疗相关性能更是超越了最新的GPT-4大模型。

基于讯飞星火V3.0,科大讯飞更推出了科研助手、AI心理伙伴等领先行业应用,并联合行业龙头共同发布12个行业大模型,并与华为共同发布了“飞星一号”大模型算力平台。

不仅如此,科大讯飞董事长刘庆峰还现场官宣:正式启动对标GPT-4的模型训练,并计划在2024年上半年完成对GPT-4的对标。

从切进大模型赛道开始,科大讯飞始终处于国际领先水平,先后以ChatGPT、GPT-4为目标。事实证明,在技术含量和产业价值两个维度,讯飞星火已经走在了国内大模型的市场前列。

01、千模大战,多而不精

2022年末,“小而美”、一度名不见经传的美国科技企业OpenAI一举发布了当时最为领先的自然语言理解大模型——“ChatGPT”。由此,全球科技领域掀起了一阵关于NLP(自然语言处理)大模型研发的创投飓风,也预示着一片充满想象力的市场蓝海开启。

根据国际数据公司IDC预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。其中,生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元,复合增长率高达91%。

另据高盛预测,未来十年,生成式AI将推动全球GDP增长7%,约合近7万亿美元。

万亿规模的市场蓝海,吸引了各方力量积极下场。过去近一年以来,大模型市场风起云涌,涌现出了科技大厂、早期成立的AI企业、知名投资人、企业家等各方参与者入局。

据赛迪顾问发布的《2023大模型现状调查报告》,截至2023年7月底,国外累计发布大模型138个,中国则累计有130个大模型问世。从数量来看,中国大模型数量仅次于美国,稳居全球第一梯队。而中美两国大模型的数量占到全球大模型数量的近90%。

不仅如此,由于国内庞大的市场需求和人才储备量,至今仍可以看到新的大模型产品不断涌现出来。

“千模大战”仍打得火热,与此同时,新一轮的洗牌或许也已悄然到来。

业界普遍认为,从市场需求而言,最终能够历经荡涤留存下来的玩家必将是有限的。

如OpenAI创始人Sam Altman所判断的:“将来应该会出现几个大型的基础模型,开发人员都将基于这些基础模型研发AI应用。”而不是每个市场参与者都从0到1地对大模型进行自研。

不仅如此,由于AI算力、训练数据等赛道资源的稀缺性,大模型市场的机会窗口也将是短暂的。

知名AI企业“小冰”的CEO李笛就曾发出论断,认为这一领域“到2024年应该就会退热,发现谁在岸上裸泳”。

那么,什么样的参与者才能经受磨砺,在一轮轮的市场洗牌中找到自己的市场位置?

除了追求技术的领先性,大模型企业们无疑还要思考,该如何真正为消费者、产业真正创造价值。

在1024开发者节上,针对大模型技术领先性和创造产业价值这两个重要命题,成立已有24年的领先AI企业科大讯飞给出了自己的阶段性答案。

02、“中文超越,英文相当”于ChatGPT

在活动现场,刘庆峰用“中文超越,英文相当”这几个字,来描述最新的星火认知V3.0与ChatGPT之间的差距。

国务院发展研究中心国研经济研究院测评报告则显示,星火大模型V3.0综合能力超越ChatGPT,国内领先,达到国际一流水平,在医疗、法律、教育行业的表现格外突出。

与此前发布的版本相比,星火认知大模型V3.0的七大能力均在持续提升。

早在5月6日星火大模型初次亮相的发布会上,刘庆峰就曾讲到:真正智能涌现的通用人工智能系统应当具备7大能力,分别为文本生成、语言理解、知识问答、逻辑推理、数学、代码和多模态能力。

在持续优化性能的基础上,星火3.0 进一步升级了数学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。

不仅如此,讯飞星火大模型V3.0新增了“虚拟人格”功能。它可以根据性格模拟、情绪理解、表达风格来形成一个初始人设,再结合特定知识学习、对话记忆学习,形成一个更个性化的AI人设。

而在落地应用方面,科大讯飞同样走在前列。

据中国电信研究院调研,如今国内外大模型发展模式主要有三种,分别是:龙头厂商利用自研的基础大模型,赋能其原有业务,如谷歌、微软等;在龙头企业发布的大模型API基础上,结合外部、公开行业数据进行微调,发布行业模型解决方案,如国内的妙鸭相机、AI法律助手等;第三种则是各行业的中大型企业,用开源大模型和自有数据,自行私有化部署大模型。

而讯飞星火认知大模型已然全面涉足了上述商业化方案。

针对赋能原有业务这一点,以科大讯飞智能硬件为例,刘庆峰分享道:“在大模型的加持下,科大讯飞的智能硬件业务总体销量增长了70%以上,学习机更是实现了200%的增长。”

本次科大讯飞也基于星火大模型V3.0对讯飞AI学习机进行了升级,首次发布了启发互动式英语AI答疑辅学功能、升级了百科问答助手功能等等。科大讯飞还推出了AI心理伙伴,能够“听懂”孩子的心事,主动回应和给出解决问题的个性化指导建议,守护青少年心理健康。

此外,讯飞星火V3.0也瞄准了众多行业应用领域。

比如在科研领域,讯飞星火与中科院文献情报中心联合打造科技文献大模型,可以实现成果调研、论文研读、学术写作三大功能;在医疗领域推出讯飞星火医疗大模型;在机器人领域发布业界首个“大模型+具身智能”的人形机器人……

在大会上,科大讯飞还联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。

私有化部署方面,面向强调数据安全的高端客户,科大讯飞提供两种交付模式。

其一是交付国产自主可控的软硬一体的星火一体机。星火一体机为讯飞与华为共同推出的软硬件一体化的私有专属大模型解决方案,官方信息显示其性能已可对标“全球AI芯片龙头”英伟达的“A100”型号高端芯片。

此外,基于客户的自有硬件,讯飞提亦可供星火大模型私有化部署和训练的“软件+服务”解决方案。

03、为什么是科大讯飞?

综合1024开发者节的整体发布情况来看,讯飞星火认知大模型在技术研发、商业落地两端都表现得超出市场预期。

事实上,这得益于科大讯飞从切入大模型市场开始,就进行着完善的规划,其中甚至包括对研发节奏、商业化节奏的精准把控。

早在5月6日,讯飞星火认知大模型首次亮相时,刘庆峰就曾公开预告:彼时发布的产品为基础大模型,公司还将在6月9日、8月15日、10月24日分别推出升级更新,预计到10月24日,星火大模型的英文能力将达到ChatGPT水平,中文能力将超越ChatGPT。这也是国内首个明确给出对标ChatGPT时间表的企业。

而在10月24日的发布会上,科大讯飞也如期拿出了其迄今为止能力最强的星火认知大模型。

不仅如此,会上刘庆峰官宣,24日起,科大讯飞正式启动全面对标GPT-4的更大参数规模的大模型训练,并计划在2024上半年完成对标。

科大讯飞还联合华为重磅发布了基于昇腾生态的“飞星一号”大模型算力平台,用以作为接下来训练对标GPT-4大模型的能力底座。飞星一号平台上,既有像华为这样的具备国产算力存储网络优势的企业,也有科大讯飞与其联合研发的各种优质的算子库。

得益于这些算子库的粘度,科大讯飞在训练大模型上的效率相较传统解决方案可以提升一倍甚至更多。

之所以有对标GPT-4的底气,是因为作为一家24岁、几乎是国内最早成立的AI企业,科大讯飞在技术储备、人才梯队培养、大模型落地场景等方面都已有积累。

科大讯飞多年来一直在技术方面潜心投入,取得了诸多成果。比如早在2014年8月,公司就推出“超脑计划”,从让机器能听会说到让机器能理解会思考迈进;2017 年,公司获批承建认知智能国家重点实验室;2022年初推出“超脑2030”计划,目标就是让机器懂知识、善学习、能进化;讯飞多年来在 Transformer 深度神经网络算法方面拥有丰富经验,核心技术保持国际领先 水平,2022 年科大讯飞共获得 13 项认知智能领域国际顶级赛事冠军。

不仅如此,在过往24年的发展历程中,科大讯飞已经构建起一支成建制的、行业顶尖的 研发团队。不少团队成员是多年来在各个联合实验室里培养出的博士;团队建制完整、高效协同、团结没有内耗,构成了科大讯飞在AI研发领域的核心优势之一。

而在商业化落地场景方面,作为智能语音及AI领域的龙头企业,科大讯飞业务早已涵盖了教育、智慧城市、开放平台及消费者业务、运营商、智慧汽车、智慧医疗、智慧金融等几大条线。

因此,讯飞星火能够快速赋能、融合到成熟产品之中,造福消费者与各类企业用户,并在不断打磨之中优化商业链路。

随着团队合力的进一步发挥、与各界合作伙伴的一同奋进、持续贯彻社会责任与使命,模型能力的进一步提升,更多的开发者、用户、企业有望聚合到讯飞星火的平台之上。

在演讲最后,刘庆峰讲到了国产大模型必须正视和GPT-4的差距:“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”而要持续探索大模型的技术上限、深化落地应用,“这个过程刚刚开始,核心技术还要持续进步。”

面向未来的星辰大海,科大讯飞代表的一批国内科技企业,还将持续前行下去。

(作者|董温淑,编辑|李原)

(注:文中插图源自科大讯飞)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1