当前位置:首页|资讯

讯飞星火4.0大升级,赶超GPT-4T还是太自信?

作者:雷科技发布时间:2024-06-27

近些日子,这大模型领域可以说是新闻接着新闻,一刻不带停的。

这前头啊,快手旗下的可灵大模型,才凭借着落地后表现不错的图生视频和视频续写功能,在迟迟没有落地的OpenAI Sora面前狠狠地表现了一把,证明了国内大模型发展速度之迅猛。

结果一转头,人家OpenAI直接发函,警告国内开发者:“将采取额外措施停止其不支持的地区的API(应用接口)使用。”,雷厉风行地切断了国内厂商和开发者们绕开限制使用OpenAI的路径。

老美这事情,也算是小肚鸡肠的典范了。

(图源:雷科技)

面对OpenAI的突然断供,腾讯、阿里、百度和科大讯飞等一众国内大模型公司,反应很快啊,迅速上线了一系列“一键搬家”服务。

简单点说,其实都差不多,为新注册的企业用户提供迁移服务,同时还赠送一定价值的Token供用户试用,讯飞星火更是面向开发者提供五项API“普惠政策”,力求帮助用户平滑切换至国产大模型。

当然,更值得关注的是,一些国产大模型并不仅仅提出了优惠政策,更是趁此机会推出了重大版本更新,试图在功能和性能上实现与国际大模型的替代。

(图源:科大讯飞)

6月27日,科大讯飞在北京国家会议中心举行讯飞星火4.0发布会。本次发布会以“懂你的AI助手”为主题,发布了讯飞星火大模型V4.0及相关落地应用:全面提升大模型底座七大核心能力,对标GPT-4 Turbo;提供云边端及软硬一体化大模型解决方案,拓展更多场景应用等。

看完发布会全程,我只能说出四个字:“有点意思”。

七大核心能力升级,对标GPT-4 Turbo

自去年五月份发布以来,讯飞星火大模型在短短一年内已经经历了数次迭代。

当初讯飞在现场给出星火大模型年内的三次升级里程碑和时间点,如今已经悉数如期落地,星火认知大模型V4.0的快速落地,更是推动着讯飞大模型能力迅速迫近行业前列。

延续着此前的良好势头,在今天的发布会上,科大讯飞星火大模型V4.0首发亮相,讯飞CEO刘庆峰表示,此次发布的讯飞星火V4.0成功提升七大维度能力并升级大模型代码,目标是全面对标GPT-4 Turbo。

(图源:科大讯飞)

单纯从理论数据来看,讯飞星火V4.0在文本生成(80.2%)、语言理解(82.3%)、知识问答(85.7%)、逻辑推理(82.2%)、数学能力(86.5%)这五项能力上已经超越了GPT-4.0 Turbo,在代码能力(81.2%)、多模态能力(78.4%)上仍然有进步空间。

当然,看数据就没啥意思,我们还得看些实际的提升。

比如说复杂指令,现在讯飞星火V4.0可以很好地理解了。

先来看看长文本溯源,讯飞研究院院长刘聪在现场和星火Desk展开了一段简单的演示。

在对话过程中,星火会主动捕捉到用户所需要的文本内容并进行溯源。例如在刘聪询问“西游记中,悟空一共被念了几次紧箍咒”的问题,星火就会在给出答案的同时、罗列对应文本的摘要以及原著中的对应内容,有效减少AI幻觉问题。

(图源:科大讯飞)

在多模态方面,讯飞星火V4.0表现又怎么样呢?

刘聪在现场为星火提供了四张图片,并要求星火Desk就这四张图片编写一段儿童故事。

讯飞星火V4.0可以按照图片内容的条理清晰地编写出一段流畅自然的儿童故事,故事里不仅包含了图片中的各种元素,最终生成的故事也有着不错的可读性,让人可以直观清晰地获取到想要了解的内容。

有趣的是,根据讯飞方面的展示,讯飞星火在应对全国高考各卷和北京中考的时候都取得了非常出色的成绩。

或许,这就是更适合中国宝宝体质的大模型吧。

从个人到企业,都有自己的“AI助手”

诚然,大模型的能力升级固然重要。

但是对消费者而言,自己什么时候才能用到大模型的能力,这些大模型的能力具体会以什么形式落地,或许才是他们更关心的问题。

在底座能力全面升级的同时,讯飞星火大模型V4.0推出多项智能应用及服务,其中目前下载量超过1.31亿次的讯飞星火APP/Desk迎来全新升级,引入了“个人空间”的概念。

现场简单设置一下孩子的人设,写出来的感想文章还挺像模像样的。

(图源:科大讯飞)

对,小孩子也能拥有自己的AI助手了。

针对智能医疗领域,讯飞晓医被单独拿出来进行了演示。

现场刘庆峰介绍,讯飞晓医APP上线的“个人数字健康空间”,它能够根据电子病历、检查报告、体检报告等用户个性化资料,构建个人数字健康空间,在看病前可以进一步剖析病症原因,用药时给出药物禁忌的个性判断,在检查后联合对比给出数据变化,并通过角色切换,了解其他家庭成员的健康状况。

(图源:科大讯飞)

按照官方的说法,那就是“为每个人提供专属的健康助手”。

在本次发布会上,讯飞还发布了基于星火V4.0赋能的星火智能批阅机。

基于强大的底座能力,星火智能批阅机在对多学科、多题型作业进行智能批改的同时,可以即时生成多维学情报告,以便老师在作业讲评时进行分层辅导。

(图源:科大讯飞)

刘聪也在现场演示了使用星火智能批阅机进行作业批改的流程,老师可以直接放入多份试卷,每一份试卷会瞬间被识别,像老师一样留痕批改,并产生一份电子扫描的副本在用星火智能批阅机里面。

有了星火智能批阅机,老师多了一个减负增效、因材施教的AI助手,原先要90分钟才能批改完的作业,现在只要5分钟就能完成;人工分析学情要60分钟,现在星火1分钟就能完成;得益于个性化作业,学生的错题解决率也从50%提升到73%。

大模型赋能更好的教育,或许就是这样子吧。

最后,针对企业级应用市场,科大讯飞也有着明确的规划。不仅发布了星火企业智能体平台,同时还发布营销、经营、招采等多个企业场景智能助手,并现场为各家企业代表进行了深度展示。

(图源:科大讯飞)

从面向个人的AI助手,到面向企业的AI助手,讯飞星火都要实现。

机遇当前,讯飞能把握住吗?

对国产大模型而言,2024年无疑是关键一年。

对大部分的中国大模型企业来说,OpenAI此举,对他们而言既是压力也是动力,可以说是,塞翁失马,焉知非福。

不可否认,现阶段,OpenAI的产品或许更有优势,这突如其来的当头棒喝,也确实能在一定程度上阻挠国内企业在AI领域的投资,但国产大模型的自主研发速度,也势必会以此进一步加速,假以时日,中国有机会成为大模型领域最大的贡献者。

此乃外因。

(图源:OpenAI)

进入2024年后,“人工智能+”行动等来自政府层面的有力支持,国内硬件厂商也普遍认知到了大模型的存在,再加上各家互联网公司对AI领域持续投入的资金、人力和研发成本,各环节协同支撑大模型发展,推动着大模型应用高速落地。

此乃内因。

此等空前的机遇,自然而然地吸引了包括科大讯飞、腾讯、字节、阿里和百度等一众互联网厂商的关注,能否用诚意、速度和效果揽获一众国产企业和国内开发者的芳心,或许会成为决定国内大模型市场格局的关键所在。

在我看来,讯飞星火V4.0在大模型领域存在着三大优势。

(图源:科大讯飞)

在模型侧,星火大模型V4.0不仅升级了原有的七大核心能力,更是在通用长文本能力上达到GPT-4Turbo今年最新长文本版本的97%水平;此外,首次实现对多语种/多方言免切换语音识别/语音交互、复杂场景多模态识别技术的支持,这些功能无疑将为人工智能的应用带来更多的可能性。

在应用侧,讯飞发布了全新升级的讯飞星火APP/Desk,让消费者可以基于自身知识库打造“更懂你的AI助手”。全新的星火企业智能体平台,更是将帮助企业用户更高效、更安全地解决真实场景需求,这是对企业服务的一次深度拓展。

此次亮相的星火智能批阅机和新款讯飞AI学习机,助力教师因材施教,为AI教育实现全面赋能。教育硬件一直是讯飞的拿手好戏,讯飞长期在该领域持续深耕。随着星火大模型底层能力的进一步提升,也必然对讯飞旗下的教育硬件类产品产生助力,在市场竞争中保持优势,获得更多普通消费者的青睐。

至于自家的传统强项——“语音”这块,星火语音大模型发布了国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”,科大讯飞现场演示了讯飞输入法混合方言和外语的语音输入效果,并展出了该技术加持的软硬件一体化讯飞同传系统。

在可以预见的未来,这项技术也会逐步赋能讯飞录音笔、翻译机等AI硬件产品,让输入效率大大提高,让多语种AI同声传译成为可能。

当然,对于被“断供”的开发者,还有最重要的一点——科大讯飞在这方面相当有经验。

在谈及OpenAI API断供中国时,刘庆峰表示,“在这个背景下,我们风起云涌的通用人工智能浪潮,到底有没有国家底座的一个支撑,将决定了我们到底能走多远。”

(图源:华为)

为了实现自主创新开源生态,科大讯飞和华为在去年联合打造中国首个超大规模国产算力平台“飞星一号”,而讯飞星火是首个基于全国产算力训练的大模型,受国际环境变化的影响最小,是毫无疑问的最强“国产平替”大模型。

自主开发的大模型和算力平台,不仅可以保证接入星火开放平台的开发者将不会再有“断供”之忧;还可以促进国内科研人员和企业的创新,推动相关领域科技进步,增强国家技术安全,加速AI技术的社会和经济应用,吸引国内底层软硬生态伙伴、行业龙头、万千开发者一起共建大模型产业生态。

我们常说,大模型的上半场是技术较量,下半场是应用落地。

如今,属于我们的国产算力平台正在高速建设着,而在应用落地上我们更是拥有着产业场景优势。要知道我国不仅有着全球最完整的产业体系,同时在教育、医疗等领域还有着全民普惠的结构,这给大模型的落地应用提供了广阔的创新空间。

最重要的是,和国外科技企业相比,中国科技企业更善于做“接地气”的落地。更加丰富的硬件品类、更快落地的技术应用、更加蓬勃的产业生态,就像科大讯飞们在持之以恒地做的事情一样。

科大讯飞的这次更新,是对未来的一次探索。它展示了科大讯飞在人工智能领域的深厚积累,也展示了中国在人工智能领域的强大实力。

属于国产的时代,或许已经不远了。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1