今天科大讯飞的星火模型发布了,我也看了发布会,主要是前面的演示部分,后面开发者啥的就不总结了(我自己看),就快速写一下(其实是边看边写)。
关于大模型,很多朋友可能都用过了,所以一些大家都有的功能也不多做介绍,就发几张图片并一一解释吧
0.语音识别
刚进直播间就发现了讯飞启动了语音识别。
我最早接触讯飞就是本科做大创的时候需要语音识别技术支持,所以了解了讯飞。
讯飞在语音识别做的还是比较好的,之后也会提到
1.评估
其实在ChatGPT出来没多久,很多团队都在关注一个问题,即ChatGPT的能力究竟如何,或者说如何评估ChatGPT的能力。
这是很麻烦的意见事情,毕竟ChatGPT是开放域ChatBot,意味着什么输入都有可能,什么回答也都有可能,以前常用的困惑度、BLUE等指标是远远不够用的。
所以目前,最准确的评估方法还是人工评估。人工评估也有自己的问题,最突出的就是需要大量人力。
讯飞这套评估体系是属于“无限细分”的方法,嘛,毕竟现在也没什么更好的方案
2.界面
界面非常经典。
其实关于ChatGPT,有些意见是说现在很多产品都做的花里胡哨,而爆火的ChatGPT却一点都没有设计感。确实,ChatGPT的UI实在是简单,那种直男排版我也能做(其实OpenAI的一些产品排版还是可以的,ChatGPT真的太朴素了)。背后其实反应的是ChatGPT的能力确实强大。
有点扯远了,不过大家可以发现语音输入是基本的一个功能,毕竟是讯飞的一个强项。
而且敢现场演示,还是挺勇的。
3.语言理解
毕竟叫做“认知大模型”了,也就是说星火对语言理解还是很有信心的,关于语言理解,一些例子:
为了防止实现设计好了问题,也请现场嘉宾提问了(没截屏)
主持人:遥遥领先于国内同行(
4.开放域问题域打假
开放域问题算是大模型必备的能力,但是给的例子很好:
据说模型在一些打假网站、科普网站数据、一些专业科学资料等资料上进行了训练,感觉挺不错的
5.逻辑推理和数学能力
现场做题做错了,说明确实是现场演示的。
就大模型来说,这个数学和推理能力已经很不错了。
解方程能力还不错,不知道时不时有借助外部工具(没有的话已经很厉害的)
现场做题做错了,说明确实是现场演示的
6.图生图?!
这个真的有点厉害。
众所周知,GPT-4输入是多模态,文心一言输出是(缝合怪)多模态,这个能做到图生图,也能做图像问答,挺好的。
当然,是不是也是缝合就不清楚了。
好像也是目前不开放,sad
虚拟人、语音输出之类的肯定是缝合进去的,就不展示了。
7.画饼
饼,大家自己看吧
8.现场收集问题
可恶,手慢了,没扫上码(毕竟边直播边写这一篇专栏)。
现场收集后现场抽题回答了,大家问的问题挺有意思的
这说明讯飞确实对模型很有信心的。据说现场的人都能看,说明确实没托(然后全是托)
9.接地气的应用
emmm,批改作业,这真的接地气啊。(当然,这个应用用了OCR[OCR也是讯飞的强项],然后过大模型,开发难度没有特别高,不过这个想法真的挺好的)
然后带货,乐。
后面是产品、开发者相关等。不写了。
10.总结
整体来说,现场演示之类的,说明讯飞对模型还是有信心的,也比较真诚。
不过还是那句话,具体性能如何还是需要亲自体验。(所以什么时候给我资格)
花师小哲-中二 2023-03-16
花师小哲-中二 2023-03-20
花师小哲-中二 2023-03-10
花师小哲-中二 2023-01-12
花师小哲-中二 2023-08-07