当前位置:首页|资讯|科大讯飞|ChatGPT

【花师小哲】鉴定网络热门(?)AI(10)——讯飞星火模型发布会小总结

作者:花师小哲-中二发布时间:2023-05-06

今天科大讯飞的星火模型发布了,我也看了发布会,主要是前面的演示部分,后面开发者啥的就不总结了(我自己看),就快速写一下(其实是边看边写)。

关于大模型,很多朋友可能都用过了,所以一些大家都有的功能也不多做介绍,就发几张图片并一一解释吧

0.语音识别

刚进直播间就发现了讯飞启动了语音识别。

我最早接触讯飞就是本科做大创的时候需要语音识别技术支持,所以了解了讯飞。

讯飞在语音识别做的还是比较好的,之后也会提到

1.评估

其实在ChatGPT出来没多久,很多团队都在关注一个问题,即ChatGPT的能力究竟如何,或者说如何评估ChatGPT的能力。

这是很麻烦的意见事情,毕竟ChatGPT是开放域ChatBot,意味着什么输入都有可能,什么回答也都有可能,以前常用的困惑度、BLUE等指标是远远不够用的。

所以目前,最准确的评估方法还是人工评估。人工评估也有自己的问题,最突出的就是需要大量人力。

讯飞这套评估体系是属于“无限细分”的方法,嘛,毕竟现在也没什么更好的方案

2.界面

界面非常经典。

其实关于ChatGPT,有些意见是说现在很多产品都做的花里胡哨,而爆火的ChatGPT却一点都没有设计感。确实,ChatGPT的UI实在是简单,那种直男排版我也能做(其实OpenAI的一些产品排版还是可以的,ChatGPT真的太朴素了)。背后其实反应的是ChatGPT的能力确实强大。

有点扯远了,不过大家可以发现语音输入是基本的一个功能,毕竟是讯飞的一个强项。

而且敢现场演示,还是挺勇的。

3.语言理解

毕竟叫做“认知大模型”了,也就是说星火对语言理解还是很有信心的,关于语言理解,一些例子:

为了防止实现设计好了问题,也请现场嘉宾提问了(没截屏)

主持人:遥遥领先于国内同行(

4.开放域问题域打假

开放域问题算是大模型必备的能力,但是给的例子很好:

据说模型在一些打假网站、科普网站数据、一些专业科学资料等资料上进行了训练,感觉挺不错的

5.逻辑推理和数学能力

现场做题做错了,说明确实是现场演示的。

就大模型来说,这个数学和推理能力已经很不错了。

解方程能力还不错,不知道时不时有借助外部工具(没有的话已经很厉害的)

现场做题做错了,说明确实是现场演示的

6.图生图?!

很模糊,但确实做到了图片的文字翻译

这个真的有点厉害。

众所周知,GPT-4输入是多模态,文心一言输出是(缝合怪)多模态,这个能做到图生图,也能做图像问答,挺好的。

当然,是不是也是缝合就不清楚了。

好像也是目前不开放,sad

虚拟人、语音输出之类的肯定是缝合进去的,就不展示了。

7.画饼

饼,大家自己看吧

8.现场收集问题

可恶,手慢了,没扫上码(毕竟边直播边写这一篇专栏)。

现场收集后现场抽题回答了,大家问的问题挺有意思的

这说明讯飞确实对模型很有信心的。据说现场的人都能看,说明确实没托(然后全是托)

9.接地气的应用

emmm,批改作业,这真的接地气啊。(当然,这个应用用了OCR[OCR也是讯飞的强项],然后过大模型,开发难度没有特别高,不过这个想法真的挺好的)

然后带货,乐。

后面是产品、开发者相关等。不写了。

10.总结

整体来说,现场演示之类的,说明讯飞对模型还是有信心的,也比较真诚。

不过还是那句话,具体性能如何还是需要亲自体验。(所以什么时候给我资格)



Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1