当前位置:首页|资讯|GPT-4

全国产化算力平台成果首发 讯飞星火V3.5三方面超GPT-4 Turbo

作者:IT时报发布时间:2024-02-10

原标题:全国产化算力平台成果首发 讯飞星火V3.5三方面超GPT-4 Turbo

作者:孙妍 来源:IT时报

1月30日,科大讯飞发布首个全国产算力训练的全民开放大模型讯飞星火V3.5,其语言理解、语音交互和数学已经超过GPT-4 Turbo。同时,星火语音大模型也正式发布,首批37个主流语种效果超过OpenAI Whisper V3,将在讯飞翻译机上搭载,并推动互联网客服、汽车、机器人等人机交互场景变革。

此外,刘庆峰提到,经过软硬件深度优化,国产算力平台“飞星一号”单机算效提升50%,通信带宽利用率提升40%,并行训练算法优化10%,其中,国产芯片的训练效率已经与英伟达A100相当。

当前,星火开发者数量已超35万,居于全国前列,为了赋能更多开发者和千行百业,讯飞星火首次开源130亿参数大模型“星火开源-13B”,这一开源大模型也是基于全国产化算力平台“飞星一号”训练而成,在昇思开源社区联合首发上线。

“在今天的大模型时代,我们绝不能只用开源模型做应用落地,在通用大模型的底座上一定要有国家队站出来。”刘庆峰强调,我们要清醒地看到差距,当前在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4最好水平还有差距,讯飞星火有信心在今年上半年赶上GPT-4目前最好水平。

全国产化算力平台首个成果 三大能力超越GPT-4 Turbo

2023年10月24日,科大讯飞与华为宣布,首个支持万亿参数大模型训练的万卡国产算力平台“飞星一号”正式启用。启用后的90多天里,讯飞星火投入到对标GPT-4的更大参数规模的大模型训练中。

2024年1月,讯飞星火V3.5诞生,成为全国产算力平台“飞星一号”的首个成果。

讯飞星火V3.5升级了语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力这七大能力,其中,语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。

“在更好的数据、更强的人机协同训练中,我们不能只看单个的‘原子’能力,而是要以技术进步来解决真实世界的刚需。”刘庆峰认为。

“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”

在实操演示环节,科大讯飞研究院院长刘聪和讯飞星火V3.5现场互动,讯飞星火V3.5一口地道的东北话逗乐现场观众。幽默之余,讯飞星火V3.5快速为刘聪定制了旅游攻略,还催促他赶快买票,春运机票紧俏。

讯飞星火V3.5正在成为一个“打工神器”,刘聪现场演示了使用讯飞智文制作的“合肥市2024年春节旅游推广策略”PPT,短时间内超20页内容丰富的PPT一气呵成,还能给每页PPT生成演讲备注,让数字人自动演讲。讯飞智文是基于讯飞星火V3.5的一款应用,可以一键自动生成文档和PPT。此外,它还对年终总结计划、述职PPT、活动策划、政策问答等任务“信手拈来”。

星火语音大模型首发 “百搭”C端硬件

“25年了,我们目标和梦想一天都没有变。”刘庆峰回忆道,科大讯飞是靠智能语音起家的,现在大模型又给语音技术带来了发展机会,借助大模型,可以让一段语音具有语种、内容、韵律、音色等属性,最重要的是,还有情绪。

据刘庆峰介绍,星火语音大模型的评测效果已经达到国际领先,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3,而在多语种语音合成方面,星火语音大模型的首批40个语种拟人度超83%。

星火语音大模型搭载的第一个C端硬件产品便是讯飞翻译机,即将上线多语种自动识别和增强式翻译两个功能,分别于今年1月底和3月中旬完成升级。多语种自动识别支持35中语言,增强式翻译主要针对中英双语这一高频互译场景。

星火语音大模型的野望,当然不仅限于赋能自家硬件产品,而是要在汽车、客服、家庭、陪伴机器人等场景有用武之地,引爆大模型的硬件之战。

大模型成亿万用户助手 走进千家万户、千行百业

自去年5月讯飞星火正式发布起,有超过60万讯飞智能办公本、智能录音笔用户累计调用语篇规整、会议纪要、自动写稿等能力650万次。目前,基于讯飞听见、讯飞星火App、讯飞输入法等应用,已累计赋能亿万用户。

此次发布会上,科大讯飞又推出了星火智慧黑板。发布现场,爱因斯坦出现在星火智慧黑板上,用“吸力巨大的吸尘器”来比喻黑洞,深入浅出地为现场观众解释“黑洞是什么”。在立体几何等知识的教学中,星火智慧黑板通过解构立方体,将枯燥的理论视觉化。

大模型正在通过硬件、软件走入千家万户。一位浙江的小学老师,使用智能问答高效完成教学方案设计,已累计使用APP262天、超2300篇;一位湖南的“情感咨询师”,通过大模型咨询人际关系等生活中的烦恼,现已累计使用161天、超9500次……

基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。

“奇瑞是安徽的骄傲,连续十几年都是中国汽车出口量的第一名。”刘庆峰介绍,奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种,汽车中应用的智能语音交互技术全都由科大讯飞提供。

在深入千行百业过程中,讯飞星火与太平洋保险打造数字劳动力,用代码能力赋能交通银行客服、展业、办公、研发等,与国家能源集团联合在煤炭、电力、运输、化工等方面打造央企集团一体化联动的大模型应用标杆。

首发开源模型 深度适配国产算力平台

在1月30日的发布会上,130亿参数的讯飞星火开源-13B首发,这也是首个基于全国产化算力平台“飞星一号”的开源大模型。全栈自主创新是它的一大优势,让企业和学术研究机构可以方便地训练专用大模型。

本次开源,既包含基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,也开源了微调工具iFlytekSpark-13B-Lora、人设定制工具iFlytekSpark-13B-Charater。

星火开源-13B在多项知名公开评测任务中名列前茅,在文本生成、语言理解、文本改写、行业问答、机器翻译等企业典型场景中,通过对学习辅助、语言理解等领域的深入研究和优化,大幅提升了其实用性,效果显著优于其他同等尺寸的开源模型。对于追求高性能而对成本敏感的企业来说,是一种性价比较高的解决方案。

在星火开源-13B训练过程中,国产软硬件环境的深度优化带来了显著的成果。科大讯飞与华为利用昇思MindSpore AI框架,训练效率提升40%,协同昇腾AI硬件,训练策略针对昇腾算力优化,训练效率达A100的90%。

在全球芯片供应链紧张的背景下,国产算力的突破为大模型行业的发展提供了强有力的支撑。

目前,华为昇思开源社区已上架星火大模型开源版-13B,面对学术、企业研究完全免费,增进学术合作的同时,增进产业探索。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1