当前位置:首页|资讯

国产大模型比落地速度 科大讯飞交出一年答卷

作者:IT时报发布时间:2024-10-25

国产大模型比落地速度 科大讯飞交出一年答卷


一张照片一句话复刻数字人


作者/  IT时报记者  孙妍

编辑/  孙妍

国内基础大模型的目标明确,就是与ChatGPT你追我赶,争取代表中国给世界第二种选择。


10月24日,又是一年程序员节,大模型到了规模化应用落地时代。科大讯飞宣布,讯飞星火4.0 Turbo的七大核心能力全面超越GPT-4 Turbo,数学和代码能力上超过GPT-4o,并在国内外中英文14项主流测试集中实现9项第一。

科大讯飞也交出了一年的成绩单:7个第一,11个首发。与此同时,国产超大规模智算平台“飞星二号”正式启动。


“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”科大讯飞董事长刘庆峰表示,在大模型规模化应用落地时代,人工智能产业发展有五大关键:顶天立地、自主可控、通专结合、端云联动、软硬一体。


全面超越GPT-4 Turbo

讯飞星火交出一年答卷

2023年10月24日,讯飞星火大模型3.0整体超越ChatGPT,医疗领域超越GPT-4。


2024年1月30日,讯飞星火3.5在语言理解、语音交互和数学这三方面的能力超越GPT-4 Turbo。


6月27日,讯飞星火4.0整体超越GPT-4 Turbo,在8个主流测试集中排名第一。

10月24日,讯飞星火4.0 Turbo在数学、代码这两项能力上超过GPT-4o。特别是数学这项硬碰硬的实力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计在今年底实现类o1的高难度数学能力。


由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实现超越,效率相对提升50%。


在大模型规模化应用落地时代到来之际,讯飞星火交出了“七个第一”的答卷:央国企中标第一,教育医疗市场第一,智能汽车市场第一,智能硬件市场第一,工业大模型第一,赋能科研应用第一,以及大模型开发者生态第一。

一张照片一句话

 复刻“数字分身”

除了发布讯飞星火4.0 Turbo外,科大讯飞还首发10项应用。其中,超拟人数字人首次亮相便震撼全场,一张照片生成数字人、一句话复刻声音。


“我是20年后的你,你有什么问题想问我?”科大讯飞研究院院长刘聪在现场与20年前的自己对话,“数字分身”刘小聪问:“我天天追的女生追到了吗?我变有钱了吗?我的发际线还好吗?”


刘小聪完美复刻了刘聪的声线,关键是只需一句话就能复刻。而且只要在后台简单编辑就能快速生成自己的卡通形象,还有1300多种人设可供选择。


超拟人数字人还有一项能力是“角色扮演”,孙悟空、小猪佩奇都学得惟妙惟肖,而且回复都非常符合人设。

刘聪现场给超拟人数字人打了个视频电话,他不断调整桌面上孙悟空、奥特曼、怪兽模型的动作,超拟人数字人就能看图说话:“奥特曼和孙悟空停止了打斗,正在联合对抗怪兽。”这项看图说话能力还能被用于旅游购物场景,替家人购物时搞不清楚化妆品用途、口红色号,就能问超拟人数字人;旅游时看到珍奇的植物,超拟人数字人也能告诉你这是什么。


超拟人的背后是科大讯飞重新定义了多模AIUI交互标准,实现语音、视频、图文的多模态互动。目前,科大讯飞超拟人数字人已经开通内测,也已将多模AIUI嵌入讯飞AI学习机阅读伙伴,让书中的故事人物可以“拟人化”呈现,与孩子们互动。

首发八语种大语言模型

端侧大模型即将上车

毋庸置疑,科大讯飞的看家本领是语音识别。刘庆峰表示,科大讯飞有实力代表中国给世界第二选择。


当天,科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种。根据实用任务场景构建测试集MMT-Eval-1.0,讯飞星火在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。


在多语言能力上,首次实现全国地级市方言全覆盖,含全国288个地市、202种方言,讯飞输入法14.0即将支持202种方言免切换自由说。


多语言能力即将落地汽车产业,紧随中国汽车产业出海。科大讯飞首发汽车端侧星火大模型,从今年第四季度起,奇瑞、广汽、长城等多款搭载端侧星火大模型的车型将上市开售。

国产超大规模智算平台启动

自主可控成核心竞争力

2023年10月24日,科大讯飞与华为联合发布首个国产万卡算力集群“飞星一号”,这是中国基础大模型走上自主可控道路的重要节点。


一年后,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”正式启动。

“一年以来我们一起攻克了很多疑难杂症,解决了500多次以上的基础软硬件问题和模型适配问题。”刘庆峰说道,“飞星二号”将带来新模型新算法的持续适配和智算集群规模的再次跃迁,持续探索无人区、引领国产大模型底座的发展、给世界提供第二选择。


“讯飞星火已成为央国企大模型的第一选择。”刘庆峰晒出成绩单:截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,300多个应用场景,所覆盖行业和场景数都是第一。


除了应用场景够多,能形成相互借鉴和复用的规模化效应外,全国产化的算力平台也是科大讯飞能拿下众多央国企AI项目的核心竞争力。

11项首发

大模型规模化应用落地时代来了

当下,大模型已经从性能超越来到规模化应用落地的竞速中,回到本质问题上,人工智能还是要解决社会刚需。


此次科大讯飞用11项首发秀了一把肌肉,除了超拟人数字人、八语种大语言模型外,还有多项教育、政务、医学领域的应用首发。


在教育领域,中国教育科学研究院与科大讯飞、华为共同研发的首个基于“问题链”的高中数学智能教师系统正式发布。它可以智能生成教学问题链,以循序渐进的方式辅助教师启发学生思考并逐步解决问题,同时基于精准学情定位学生薄弱点、融合最近发展区规划路径、鼓励学生基于真实世界的主动提问、探究式学习。


该系统是中国教科院牵头,北京、上海、重庆、深圳、合肥、成都、大连、广州、哈尔滨等12个区域50多位数学教研员、400多位优秀教师与讯飞星火大模型人机共创的成果。

普通的黑板植入高中数学智能教师系统后,就能变身教学AI助手。星火智慧黑板2.0也于10月25日在第84届教育装备展上发布。


此外,讯飞AI学习机首发AI作业过滤器。学习机通过OCR能力识别出纸质练习题,根据学生历史学习情况和本地化考情,将题目分出“必做题”“选做题”“建议不做题”三个等级,让学生能够练得更少,却学得更好。

在医疗行业,基于讯飞星火医学影像大模型,科大讯飞打造了智能医学影像助手,在智能质控环节,可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。讯飞医疗还联合安徽省卫生健康委员会、认知智能全国重点实验室,共同发布全谱系全模态医学影像大模型开放合作计划。


发布会上还首发了搭载政务大模型的“星火智办一体机”,在政务服务场景,星火政务大模型已覆盖4500多种标准化事项和60多种材料,老百姓和政务大模型“聊天”就能实现边聊边确认办事意图,审核时间缩短80%,登记效率提升5倍。


能够规模化落地的前提是生态完善,而开发者是最重要的一环。根据IDC研究报告和市场公开数据显示,科大讯飞在语音语义市占率中第一、大模型开发者规模第一,达78.1万。科大讯飞在发布会上表示,将开放全场景资源,从技术能力到应用落地,用最短路径帮开发者实现产品迈向市场,还牵头成立5亿元AI基金,并与地方政府联合为AI创业团队提供产业落地支撑。

AI for Science决定科技速度

AI科学家成诺贝尔奖大赢家

今年的诺贝尔物理学奖、化学奖、经济学奖都颁发给了 AI 领域的科学家。刘庆峰表示,AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎。


星火科研助手自去年底发布以来,已在中科院下属116个院所使用。北京邮电大学EZCoding雏雁/大创团队基于讯飞星火大模型打造的编程教学应用平台“码上”,目前已在全国332所院校开通使用,学生主动提问率增加1倍,教师辅导工作减少80%。


据悉,科大讯飞已在大模型+科研领域做了许多探索,如联合中国科学技术大学刘海燕教授团队,成功设计了48个自然界不存在的全新蛋白质;联合中科院动物研究所李鑫团队,研究单细胞基因表达课题;联合中科院等离子体物理研究所李建刚院士团队,研究托卡马克等离子体控制。此外,科大讯飞还联合中国科技大学研发“化学大模型”,联合中科院大连化学物理研究所研发“化工大模型”。


“AI for Science决定了中国科技发展速度。”刘庆峰说道。

排版/ 潘璐

图片/ 科大讯飞

来源/《IT时报》公众号vittimes

E N D


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1