6月9日,科大讯飞在24周年司庆当天,发布讯飞星火认知大模型V1.5,这也是继5月6日科大讯飞大模型公开以来的第一次迭代。短短的一个月零三天,这个升级版本做得到底怎么样?是否能按照先前公布的时间表实现对标ChatGPT的目标?这就是它的第一次摸底考。
此前我们体验了这款大模型V1.0版本,并对比了它与ChatGPT对中文自然语义的理解能力。得益于其本身作为一款中国本土市场的AI模型,能够基于海量中文文本语料进行训练,同时在相关的核心算法上也更贴近中文的使用环境和习惯,在对中文自然语义的理解方面,讯飞星火认知大模型拥有先天的优势。
按照讯飞官方公布的迭代节点,6月9日的升级,星火将突破开放式问答,多轮对话能力明显提升,数学能力再上一个新的台阶。在体验过V1.5后,我发现,除了对中文自然语义的理解能力,其甚至还升级了语义表达中的情感色彩认知能力。
比如:“女孩子对男孩子说,你是一个好人”,讯飞星火V1.5给出的理解是:
在对这句话做出情感倾向的分析之后,讯飞星火V1.5最后还提醒到:“虽然这句话本身代表了积极情感,但并不代表就一定发展到了恋爱程度,人们用‘好人’来形容某个人,只是单纯地表示欣赏和尊重,并没有其他深层次的感情含义。”
显然,讯飞星火V1.5对于“发好人卡”这件事还是有所领悟的。
而在多轮对话能力上,除了对上下文理解的加深,讯飞星火V1.5同样能够在这当中加入情感倾向的分析。
例如将“女孩子哭着对男孩子说,你这个大笨蛋”这句话输入讯飞星火V1.5,它认为这句话可能包含愤怒、失望、沮丧等消极情绪。但换成“女孩子边笑边哭对男孩子说,你这个大笨蛋”,讯飞星火V1.5则会告诉你,这个女孩可能喜欢你。
不得不说,在理解女生这件事上,讯飞星火V1.5可能已经超过了一部分人了。
当然,相对于这些单一的自然语言的理解能力,能够帮助我们写邮件、做策划的文本生成能力,更是这类语言大模型在当下最具“生产力”的特性。在之前的测试中,讯飞星火大部分时候生成的文本,都能够做到“拿来即用”的水平。
除此以外,文本总结能力同样也是其当下极具生产力特性的场景。对于AI可能带来的改变,科大讯飞刘庆峰就曾提到,“可以成为科研工作的加速器,把年轻、优秀的工作人员的大量收集资料、边缘工作的时间节省下来,AI for Science也可以再上台阶。”
为了测试讯飞星火V1.5的文本总结能力,我将《入手必看!教你怎么选最实用的中端机》这篇文章输入了进去,全文共3500字,主要分析了中端手机市场的细分趋势,以及面对这种“专机专用”的情况,消费者该如何选择的问题。
可以看到,讯飞星火V1.5将这篇文章总结到了350字左右,是原文的十分之一,四个分段正好对应文章的四个部分。更让我惊讶的是,它还准确地提炼出了针对不同用户需求,可以选择的具体手机型号,这部分正是整篇文章的精华所在,为用户给出了直接的答案。
我们都知道,讯飞这些年在教育领域一直都有深入的拓展,后续借助讯飞星火大模型的能力,科研类产品也将会得到飞速提升,将资料收集、信息处理的时间大量节省下来,将会给科研行业带来更多的赋能。除此外,从长远来看,这方面的创新和布局,在很多领域也都拥有很广阔的应用前景和想象空间。
在5月份星火认知大模型的发布会上,刘庆峰也表示,“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试”。
这次讯飞星火V1.5除了提升各项能力指标之外,也变得更走进千家万户了。发布会上,科大讯飞推出了“星火助手中心”,星火APP(iOS、安卓)和小程序。这意味着,每个人接触AI大模型的门槛都更低了,只需要在手机上就能实现与大模型的交互体验。
同时,星火APP还支持全语音对话、多模态输入等。只需长按输入框中的语音输入按钮,APP会实时将语音转化为文字,语音说完后松手,文本问题随即发送。
大模型给出答案后,点击对话框下方“播放按钮”,即可实现对文本内容的朗读。在“设置”中还可以选择发音人体验不同音色合成播报效果。在语音的一问一答中,获得更符合使用习惯的交互体验。
另外,在多模态输入方面,星火APP中的数学解题助手已可以自动识别上传图片上的问题,并支持手动选中具体的问题,从而给出更加精准的答案,以及解题步骤。
“星火助手中心”的出现更是大大简化了大模型的交互方式。以文本生成为例,过去我们需要为AI模型赋予身份、描述背景、提出需求,然后生成文本,比如我们想让AI模型创作一个故事,需要赋予它故事创作者的身份,然后描述出故事背景,再由AI进行文本生成。
现在只需要用星火助手中心的“故事创作助手”,给到它一句故事思路,它就能把故事编写下去。
同样,你可以直接输入PPT的核心内容,“PPT大纲助手”会提供PPT大纲;输入周报的提示内容或关键词,“周报小助理”可以帮你润色周报……
本次发布的星火助手中心,官方上线了200+小助手,涵盖了职场、营销、学习、点评、创作、生活、出行、趣味等多种应用场景。在官方提供的助手之外,还同步上线了助手创作中心,支持用户新建助手。
用户还可以选择将自己创建的助手在助手市场上架分享,向所有用户开放使用,实现星火助手规模的快速规模增长,同时激发更多用户创建助手的灵感。根据实测,6月9日发布会介绍时助手数量为200+,6月14日数量已经达到近600个,增长非常迅速!
不仅是在电脑端,在APP端,用户也可以直接调用星火助手中心,在文本输入框中,输入@,可以很方便地调用进入需要的助手模式。同一个账号下,电脑端和APP端的历史对话以及使用过的助手及对话内容都是实时同步的,真正做到了随时随地想用就用。
可以说,讯飞打造的这种新的Prompt“应用开发”场景,通过大模型降低应用开发门槛,让创意即想即用。也正如刘庆峰所说的那样,大模型不是为测试而生,而是要真正解决有用、好用的问题,讯飞星火V1.5的到来,让AI大模型进入人人可用的时代。
在星火大模型发布之际,科大讯飞董事长刘庆峰给出了星火年内的三个关键里程碑,以达到今年10月通用模型能力对标ChatGPT的目标。这也是国内大模型厂商唯一明确给出升级时间表的。
我们知道,今年以来AI大模型爆火,国内已有数十家企业入局,“百模大战”的序幕已经拉开,在大战之初,讯飞是不是显得太着急?但从一个月前星火大模型的第一次测试,到今天对星火V1.5的深入体验,我们可以清晰的得知,讯飞星火并非蒙眼狂奔。
从星火V1.0到星火V1.5,不仅是版本升级,更显示出在产品能力升级、产品应用以及共建生态方面,讯飞大模型的有序快速迭代。
星火助手中心的到来,将帮助讯飞开放平台降低技术开发门槛,有助于更多开发者完成诸多智慧涌现的工作,同时集成越来越多的专业插件,让生态体系更加繁荣。
据了解,截至5月份,讯飞开放平台已有400多万实名认证的开发者、500多万的合作伙伴。同时讯飞已经与36个行业、超3000家企业达成明确合作意向。
刘庆峰谈道,“星火大模型,就是寓意星星之火、必将燎原。”讯飞的“燎原行动”也并非科大讯飞一家来做,还将与全国的创新平台共同合作,把能力开放给讯飞开放平台的开发者生态、羚羊工业互联网平台等,共同形成比较优势,助力所有人在人工智能全新平台上创新创业、对外合作,带来人工智能开放生态的全面升级。
讯飞的时间表,正是其一步一个脚印,朝着最终的目标——让人工智能造福全人类迈去。中国版ChatGPT绝不是讯飞星火的终点,而是逐渐从萌芽破局到落地转化,最终成长为一颗为服务民生刚需、产业发展的参天大树。
长期主义的梦想需要一个又一个阶段里程碑来实现。8月15日,星火大模型聚焦于代码能力升级以及多模态交互能力提升的二次迭代,让我们一起期待见证它的下一个里程碑。