本报记者 陈佳岚 合肥报道
科大讯飞AI大模型又有了新进展。10月24日,《中国经营报》记者从科大讯飞方面获悉,讯飞星火认知大模型再次升级至3.0版本,七大能力得到提升,并联合华为再次推出基于昇腾生态的“飞星一号”大模型算力平台。
5月6日,科大讯飞发布星火认知大模型,并向外界实时展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态等多项能力。6月9日,讯飞星火认知大模型V1.5推出,开放式知识问答、逻辑推理数学及多轮对话等能力得到升级。8月15日,讯飞星火认知大模型升级至V2.0版本,代码升级和多模态能力得到提升。
继宣布追平ChatGPT-3.5之后,科大讯飞董事长刘庆峰也提出了进一步目标,表示讯飞星火大模型在2024年上半年要对标ChatGPT4。
大模型七大维度能力升级 已对标ChatGPT-3.5
记者了解到,讯飞星火认知大模型V3.0在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面都有了持续的提升。
刘庆峰在科大讯飞2023全球1024开发者节上表示,星火认知大模型V3.0全面对标ChatGPT(GPT3.5),中文能力客观评测超越ChatGPT,英文能力对标ChatGPT48项任务结果相当。
国务院发展研究中心,国研经济研究院的一项横评报告显示,星火大模型3.0版综合能力超越ChatGPT,在医学、法律、教育、零售、汽车工程、计算机和工业设计等行业表现格外突出,准确率分别达到69.3%、71.4%、82.2%、61.2%、78.4%、76.9%和66.4%。
据OpenAI在其官网发布的英文任务测试集测试数据,星火认知大模型V3.0在48项任务中与ChatGPT结果相当,已经做到了85.1%,略微领先ChatGPT的84.3%;而在《通用认知智能大模型评测体系》构建测试集测试中,星火认知大模型V3.0中文能力客观评测超越ChatGPT。
不过,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT-4还有差距。”他表示,唯有实事求是的科学精神,才能真正实现超越。
此前,科大讯飞已联合华为推出了讯飞星火一体机,开始布局大模型算力,重视算力安全,性能已可对标英伟达A100。在1024全球开发者节现场,科大讯飞又联合华为发布基于昇腾生态的“飞星一号”大模型算力平台。
刘庆峰透露,在此基础上,讯飞星火大模型将开启对标GPT-4的更大规模训练。科大讯飞的目标是大模型在2024年上半年实现对标GPT-4。
事实上,与华为合作布局算力平台,科大讯飞也需要克服很多难点,“原本用英伟达可能一个月就能干成的事情,现在使用华为会面临更多不确定性因素,可能需要三个月才能完成,科大讯飞不仅要大规模投入、‘磨练武器’,还要盈利、同时面临市场竞争。”刘庆峰对记者坦陈,使用国产算力平台意味着大模型在起步阶段可能需要更长的训练时间,但这是中国发展自主可控大模型的必经之路。
“从早期的国产操作系统到现在的国产算力平台,都是需要打磨,从不好用到好用再到生态的繁荣的过程,如果谁都不往前走一步,没有能够坚定提供底座的厂商,国家始终是没有办法自立自强。”刘庆峰表示,科大讯飞最早期会使用一部分英伟达的算力,现在正在逐步将算力完全替换,主要使用国产平台。
刘庆峰透露,讯飞星火大模型从V3.0版本后都会在华为算力平台上训练。
10月17日,美国政府进一步收紧对尖端人工智能芯片的出口管制,严格限制英伟达和其他芯片制造商向中国销售高性能半导体。根据新规,受到管制的英伟达芯片涉及A100、A800、H100、H800、L40,甚至包括RTX4090。
科大讯飞董事会秘书、副总裁江涛在三季报业绩说明会上表示,“这对将大模型构建在英伟达算力上的大模型厂商会产生比较大的影响。不过,讯飞与华为昇腾启动专项攻关,与华为联合研发高性能算子库,合力打造我国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。正是由于科大讯飞的星火大模型实现了自主可控和科技自立自强,因此星火大模型未来具备走出国门,面向全球不同国家、不同语种的亿万用户提供AI服务的机会。”
大模型“烧钱”影响利润 刘庆峰称明年仍将加大投入
不过,在不断加大对大模型投入的同时,也在一定程度上影响到了科大讯飞最近一个季度的净利润表现。
科大讯飞刚刚发布的三季度财报显示,对大模型投入成为了其当季利润下滑的主因。面对投入大模型带来的业绩阵痛,外界感慨:大模型太“烧钱”了。
科大讯飞三季报显示,前三季度实现营业收入126亿元,同比略微下滑0.27%;归属于上市公司股东的净利润9936万元,同比下滑76%。其中,第三季度净利润仅为2579万元,同比下滑82%。
对于净利润的大幅下滑,科大讯飞表示,主要原因系公司积极抢抓通用人工智能的历史新机遇,在通用人工智能认知大模型等方面坚定投入。前三季度科大讯飞开发支出逾10亿元,同比增长约44%,公司表示这“主要系本期研发投入增加所致”。另外,由于项目投入周期增加长期借款补充流动资金,科大讯飞长期借款较期初增长69.64%至29亿元。
科大讯飞表示,尽管上述投入一定程度上影响了当期利润,但为公司在数字经济时代长期可持续发展奠定了坚实基础和难得的先发优势:一方面,使公司在人工智能赋能教育医疗等民生事业、赋能千行百业的数字化、智能化转型过程中强化了领先优势,同时也为公司在人工智能时代打造每个人的AI助手、开拓更广阔的C端消费产品市场带来全新机会。
而科大讯飞对大模型的投入短期之内是否仍将保持这样的投入水平?刘庆峰向记者表示,“目前阶段大模型仍有很多工作要做,科大讯飞仍在只争朝夕落地产品,明年仍会是强投入。”
不过,刘庆峰看好明年大模型带来的商业收益及毛利提升,也将带来行业市场份额和影响力的提升。
“而科大讯飞新增的毛利也会坚定不移地投入到大部分新研发中,明年仍不一定要实现投入产出平衡。”刘庆峰表示,“明年至2025年,科大讯飞将会处于良性状态,收入、毛利快速增长后,能够覆盖新增投入。”
而事实上,目前几乎所有的大模型公司都处于投入阶段,不管是科大讯飞还是百度、阿里、腾讯无一例外都在疯狂“烧钱”加码大模型投入。在互联网分析师丁道师看来,“大模型是人工智能发展到今天最值得关注的一个领域,赋能金融、医疗、教育、政务、创作等众多行业,进而实现降本增效,所以国内有实力的企业都愿意不计成本地投入。”
“对于当前的大模型企业来说,目前都处于战略性投入阶段,战略性投入是为了将来的战略性盈利。”丁道师对记者表示,当下盈利对于大模型公司来说并没有这么着急,当前所有的大模型企业都在抢跑,打好基础反而更重要。
丁道师认为,这些公司的大模型什么时候能够改善业绩情况还要看大模型商用落地情况,能进入多少个行业、有多少企业买单,谁能最快在B端市场拿到更多单子,至少在很长一段时间里大模型要想实现多盈利,最先取得突破的一定是B端市场,然后才是C端市场。
(编辑:吴清 校对:陈丽)