讯飞星火V3.5对标GPT-4，但更大潜力在落地场景

作者：雷科技发布时间：2024-01-31

GPT-4 人工智能

2024年，生成式人工智能仍然是最引人注目的科技焦点。

从初期对人类指令懵懵懂懂的所谓「人工智能」，到今天听到一个口令就能老老实实地为我们绘画、写稿……AI带来的生产力显著提升，很多人都希望用它辅助自己的工作学习，以此提高效率，甚至偷点小懒。

在AI的浪潮下，当前国内科技龙头企业密集推出人工智能大模型，腾讯、华为、阿里、百度等巨头纷纷入局，投入资源、潜心研究，业界呈现出百花齐放、迅猛发展的态势，“百模大战”如火如荼。

不过，目前国内外各家大模型，其实很多都处在内部测试阶段，仅注册门槛、使用门槛就已经拦截了99%的用户。

在这之中，早早开启全民测试的讯飞星火，是个特殊的存在。

1月30日，科大讯飞发布了基于首个全国产算力平台「飞行一号」训练的全民开放大模型——讯飞星火V3.5版本。

（图源：科大讯飞）

相较于上一个版本，讯飞星火V3.5版本在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等七大核心能力上均实现大幅提升，进一步逼近GPT-4 Turbo的最新水平。

不仅如此，科大讯飞还在本次发布会上带来了全新的星火语音大模型，以及首个深度适配国产算力基建的讯飞星火开源大模型，持续建设夯实国产大模型业态，为实体经济带来新机遇。

还是老规矩，没蹲发布会的朋友们，就跟着小雷往下看吧。

核心能力全面升级，对标GPT-4

自从去年五月份发布以来，讯飞星火大模型在短短八个月内经历了数次迭代。

当初讯飞在现场给出星火大模型年内的三次升级里程碑和时间点，如今已经在6月9日、8月15日、10月25日如期落地，星火认知大模型V3.0的快速落地，更是推动着讯飞大模型能力迅速迫近行业前列。

（图源：科大讯飞）

先来看看多轮对话，讯飞研究院院长刘聪在现场和星火V3.5展开了一段稀松平常的家常对话。

在对话过程中，星火会主动捕捉到用户当前所处的状态并积极发问。例如在刘聪表示年末琐事很多很辛苦后，星火会主动询问刘聪过年准备去哪里旅游放松，并针对刘聪提出的目的地给出了详细的旅游建议。

（图源：科大讯飞）

不难看出，讯飞星火认知大模型V3.5已实现从多轮对话、主动对话再到启发探究式对话的跨越，能够实现人机完全主动交流对话。

在语义理解、指令跟随、多轮对话、情绪感知和拟人合成等核心能力进步后，星火V3.5将有望彻底改变万物互联时代的人机交互模式。

（图源：科大讯飞）

在语言语义理解方面，讯飞星火3.5表现如何？刘聪先是为星火提供了一篇安徽省的报告，并要求星火就这篇文章提出5道理解题。

（图源：科大讯飞）

随后，他要求星火条理清晰地回答其中的第一道题和第三道题。

星火V3.5可以按照文章内部的顺序条理清晰地回答两道问题，不仅仅概括了这段文字讲述的具体事件，更能就文章内容给出自己的态度和观点，让人可以直观清晰地获取到想要了解的信息。

（图源：科大讯飞）

文本生成方面，在导入现有资料后，讯飞智文可基于合肥2024年春节旅游介绍这个主题，快速生成PPT提纲和不同风格的PPT，甚至可以在确定PPT内容后自动生成相关联的AI演讲备注和讲述人。

（图源：科大讯飞）

对，这下不仅PPT不用动手做，甚至可能都不需要你动嘴来讲了。

最后来考考逻辑推理能力，刘聪当场提出了一些容易误导大模型出现AI幻觉的问题。

比如“脸盆里面漂浮着一块冰，请问冰融化之后，脸盆里面的水位是会上升还是下降？”“一个人出门散步，前进20米，右转60度，前进20米，再右转60度，如此反复下去，请问他能不能回到原点？如果能回到原点，一共走了多远？”等问题，结果，星火V3.5均能准确回答。

即便是基于立体图形的几何题，星火V3.5都给到了一个与事实相符合的答复。

（图源：科大讯飞）

从这些问题的答案中可以清晰地看出，星火V3.5在逻辑推理能力方面已有一个比较优质的体现，能够对用户提出的问题提供更加准确、全面和专业的回复。

或许，这就是更适合中国宝宝体质的大模型吧。

（图源：科大讯飞）

首次发布语音大模型，让对话更自然更真实

提起科大讯飞，「语音」是很多人想到的第一标签。

即便是在被持续制裁的情况下，讯飞语音也始终走在世界前列。而语音，是AI的基础，不论是NLP(自然语言处理）、知识图谱、语义理解、语音识别、语音合成，均是核心的AI技术。语音AI的多年发展，是大模型的重要基础，反过来，大模型也将进一步强化语音AI技术。

如今，在大模型推动语音技术突破后，人机交互将迎来新的发展阶段。

（图源：科大讯飞）

星火语音大模型由多语种语音合成，在首批37个主流语种上已整体超越OpenAI公司推出的Whisper-large-v3，保持科大讯飞智能语音技术的国际领先水平。

不仅如此，星火语音大模型在首批40个语种平均MOS（Mean Opinion Score，评估音频质量的一种分数）分绝对提升0.25，MOS达到了4.5，拟人度达到了83%以上，成功保持科大讯飞在智能语音技术上的国际领先水平。

（图源：科大讯飞）

讯飞翻译机将成为首批搭载星火语音大模型的硬件产品。此外，讯飞语音大模型还可被广泛应用于智能客服、智能播音、语言助手、车机互联等领域。

（图源：科大讯飞）

星火智慧黑板，新一代专业教育硬件

在本次发布会上，讯飞还展示了基于星火V3.5赋能的星火智慧黑板。

这块智能黑板，不仅能够智能识别教师的板书，将板书数字化，还能基于板书内容提供相关课件资料供学生参考，甚至可以实现立体建模的拆解划分，让图形变得更加直观。

（图源：科大讯飞）

至于学校很难配备的口语教师和科学教师，星火智能黑板也都有集成，让孩子们可以练好口语和学习科学；而对老师课程记录的汇总与亮点提取功能，则让孩子们可以更好地对不清楚的知识点查漏补缺地复习。

OpenAI创始人奥特曼就曾表示，他本人特别看好的AI应用领域有两个：一个是医学顾问，另一个就是赋能教育。 至少在后一点上，依托科大讯飞在教育行业的多年积累，星火V3.5做到了。

讯飞星火“两手抓，两手都要硬”

不难看出，在大模型的发展上，讯飞星火做到了「两手抓，两手都要硬」。

一方面，讯飞在持续投入迭代星火大模型，推动着自然语言交互、多场景内容生成、语音等核心能力不断提升，并通过积极地对外开放测试，力求成为用户生活和工作中不可或缺的小助手。

另一方面，在「平台+赛道」的战略指引下，科大讯飞坚持深耕人工智能生态建设，力求让「讯飞星火」普惠更多行业，有效提升现有产品的生产力，同时曾经高不可攀的社会创新创业门槛也得以降低。

（图源：科大讯飞）

大模型的上半场是技术较量，下半场是应用落地，必须从技术参数的军备竞赛、好玩炫酷的演示Demo，走向千行百业，实现应用落地、赋能场景、服务人类的生活、工作、学习与娱乐，才能释放出技术该有的价值。

在下半场，中国玩家拥有产业场景优势，要知道我国不仅有着全球最完整的产业体系，同时在教育、医疗等领域还有着全民普惠的结构，这给大模型的落地应用提供了广阔的创新空间。与此同时，中国科技企业更善于做“接地气”的落地，就像科大讯飞们在做的事情一样。

为了进一步加速大模型行业落地，科大讯飞还正式推出了首个深度适配国产算力的讯飞星火开源大模型，吸引国内底层软硬生态伙伴、行业龙头、万千开发者一起共建大模型产业生态。

属于国产大模型的时代，正在到来。

讯飞星火V3.5对标GPT-4，但更大潜力在落地场景

推荐体验

相关资讯

讯飞星火 V3.5 体验：整体接近 GPT-4

部分功能已超GPT-4！讯飞星火V3.5亮相

全国产算力平台“飞星一号”首个成果：对标GPT-4，讯飞星火V3.5发布

讯飞星火认知大模型V3.5亮相：全面提升部分赶超GPT-4

讯飞星火V2.0正式发布全新应用场景明年对标GPT-4

近期资讯

Android OpenGLES2.0开发（八）：Camera预览

我不允许还有人不知道前端实现时刻洪水模拟的方法！🤩

【算法】腐烂的橘子

如何判断设备是折叠屏,全网最准的方法,没有之一！

一个Kotlin版Demo带你入门JNI,NDK编程

超越Claude 3.5紧追o1！DeepSeek-V3-Base开源，编程能力暴增近31％

写个hoc来应付小程序的审核！

模仿 SU7 网页特效实现3D旋转地球

Karpathy力荐博客：写代码的时候，请心疼一下读代码的同事

ArkWeb页面拦截与自定义响应 - 控制加载过程

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响