科大讯飞宣布大模型全面超越ChatGPT
作者/ IT时报记者 孙妍
编辑/ 孙妍
“星火大模型3.0已经整体超越ChatGPT,医疗领域超越GPT-4,2024年上半年,我们将实现对标GPT-4。”10月24日,科大讯飞董事长刘庆峰宣布讯飞星火认知大模型实现了既定目标,并定下下一个攀登目标。他相信,通用人工智能是未来确定的机会。
10月24日程序员节,在第六届世界声博会暨2023全球1024开发者节上,科大讯飞发布讯飞星火认知大模型V3.0,并与华为昇腾生态共同发布“飞星一号”大模型算力平台,开启对标GPT-4的更大参数规模的星火大模型训练。
讯飞星火整体超越ChatGPT
讯飞星火在2023年5月6日发布,此后便一直在加速。8月15日,讯飞星火V2.0发布。
10月24日,讯飞宣布星火V3.0全面对标ChatGPT,中文能力客观评测超越ChatGPT,英文能力对标ChatGPT 48项任务结果相当,尤其在医疗领域超越GPT-4。
国务院发展研究中心国研经济研究院测评报告显示,星火大模型V3.0综合能力超越ChatGPT,在医疗、法律、教育行业的表现突出。
不过,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距离GPT-4还有差距。”他表示。
跟讯飞星火V2.0比,V3.0版主要提升了数学自动提炼规律、小样本学习等技术能力,同时提升落地应用能力。
自5月6日星火发布以来,讯飞开放平台新增大模型开发者17.8万,正在与10万多企业客户用星火创新应用。此次大会上,科大讯飞发布12个行业大模型,包括金融、汽车、运营商、工业、住建、物业、法律等行业。
联手华为打造大模型国产算力平台
如今,算力紧缺已经成为大模型发展的一大阻碍,高性能AI算力芯片的禁令升级,这也为国产算力芯片空出一片市场。
“华为致力于打造中国坚实的算力底座,为世界构建第二选择。”华为副董事长、轮值董事长徐直军在大会上表示,“飞星一号”将为更大参数的星火4.0提供算力支撑。目前,华为公司在全球所有智能终端的语音技术都来自科大讯飞,未来将与科大讯飞在大模型领域开展更多合作。
“飞星一号”是科大讯飞联合华为发布的大模型国产算力平台,是基于华为昇腾生态打造的自主可控大模型训练平台,用来训练对标GPT-4的、上万亿浮点参数规模的星火大模型。
半年内,讯飞和华为成立的“联合特战队”实现星火大模型训练和推理效率均翻番。“华为专门派了特战队入驻科大讯飞,中秋节都在合肥加班,同时也感谢中国电信给的环境保障。”刘庆峰在大会上提到。
此前在2023年8月15日的讯飞星火V2.0发布会上,科大讯飞和华为昇腾AI联合推出星火一体机,其底层算力、AI框架、训练算法、推理能力、应用成效等AI能力都能“开箱即用”,每家企业或机构都能在这一国产大模型算力底座上构建专属大模型。
“讯飞跟华为共同推出的讯飞星火一体机,它的性能已经开始对标A100。”刘庆峰曾在9月20日华为全联接大会上表示。
医疗大模型超越GPT-4
在整体追赶GPT-4的过程中,讯飞星火大模型跑得最快的领域是医疗领域。
科大讯飞表示其医疗领域大模型能力已超越GPT-4,其依据是实际使用数据抽查12万例,以及国家科技信息资源综合利用与公共服务中心(STI)第三方测试数据,星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。
10月24日当天,讯飞星火医疗大模型发布,搭载该大模型的“讯飞晓医”App也同步推出。
今年5月6日就发布了讯飞星火认知大模型,为什么要到10月24日才发布医疗大模型?刘庆峰表示,早在2017年讯飞智医助理就已经通过国家执业医师资格考试,排名超过96.3%的人类考生,首先给基层医院和等级医院的医生提供帮助,大模型就在辅助过程中挽救了一个新生命,将患者“疑似妊娠”的诊断修正为“先兆流产”。
如今,医疗大模型从医院走入普通家庭。据统计,全科医生缺口达30万人,等级医院的医生能分配给每个病人的诊疗时间只有3分钟,看病之前问讯飞晓医,将大幅提升问诊效率,健康自查有效度提升40%。每年零售药店买药人次达67亿,购买非处方用药占比达45%,用药有疑问可以问讯飞晓医,帮助普通人更合理用药,高风险用药召回率提升90%。每年体检人次5.5亿,5000字体检报告眼花缭乱,讯飞晓医可以马上生成重点及健康提醒,帮助人们“对症复诊”。
大模型到底有什么用?
中国首批大模型版号发放至今,11家国产大模型获批上线,科大讯飞星火大模型就是其中之一。
自9月5日向全民开放后,已有1200万用户使用讯飞星火大模型,他们对大模型提出两大需求:“不仅能回答问题还要能提出问题”、“不仅要有知识还要有个性”。
如何打造一个像人一样主动提问、又有“灵魂”的大模型?
星火V3.0新增虚拟人格功能,可以为大模型打造人设,该功能已在“星火友伴”上线,可以跟哪吒、诸葛亮等人物对话。
除了在C端实现从回答到提问、从知识到个性的能力突破外,大模型正在向工业和科研领域渗透。
在本次大会上,唯一独立发布的产品便是智能编程助手iFlyCode2.0。讯飞星火大模型整体超越ChatGPT,其代码能力尤其突出,在编程的设计阶段提效50%、开发阶段提效37%、测试阶段提效44%。
产业数字化和数字产业化都离不开代码能力的支持。数据显示,中国有约800万软件从业人员,2022年软件业务收入10.8万亿元,占GDP比重8.93%,2028年预测将达到20万亿元。
大模型为科研人员、程序员提供了生产力工具,科大讯飞在内部使用大模型辅助程序员写代码时产生了很多效率倍增的案例,20万行代码从Windows移植到linux,用传统开发方式需要花3个月,而在iFlyCode辅助下,只花了1个月。
大模型也降低了开发者门槛。在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。iFlyCode发布以来,已在京东云、软通动力等107家机构实现深度对接应用。今年11月份,几乎全国所有软件名城都会和科大讯飞开展相关合作。
数据之外,大模型在行业和生活中能发挥多少实效,还要待用户考验。
排版/ 季嘉颖
图片/ 科大讯飞
来源/《IT时报》公众号vittimes
E N D