【花师小哲】鉴定网络热门（？）AI（10）——讯飞星火模型发布会小总结

作者：花师小哲-中二发布时间：2023-05-06

科大讯飞 ChatGPT

今天科大讯飞的星火模型发布了，我也看了发布会，主要是前面的演示部分，后面开发者啥的就不总结了（我自己看），就快速写一下（其实是边看边写）。

关于大模型，很多朋友可能都用过了，所以一些大家都有的功能也不多做介绍，就发几张图片并一一解释吧

0.语音识别

刚进直播间就发现了讯飞启动了语音识别。

我最早接触讯飞就是本科做大创的时候需要语音识别技术支持，所以了解了讯飞。

讯飞在语音识别做的还是比较好的，之后也会提到

1.评估

其实在ChatGPT出来没多久，很多团队都在关注一个问题，即ChatGPT的能力究竟如何，或者说如何评估ChatGPT的能力。

这是很麻烦的意见事情，毕竟ChatGPT是开放域ChatBot，意味着什么输入都有可能，什么回答也都有可能，以前常用的困惑度、BLUE等指标是远远不够用的。

所以目前，最准确的评估方法还是人工评估。人工评估也有自己的问题，最突出的就是需要大量人力。

讯飞这套评估体系是属于“无限细分”的方法，嘛，毕竟现在也没什么更好的方案

2.界面

界面非常经典。

其实关于ChatGPT，有些意见是说现在很多产品都做的花里胡哨，而爆火的ChatGPT却一点都没有设计感。确实，ChatGPT的UI实在是简单，那种直男排版我也能做（其实OpenAI的一些产品排版还是可以的，ChatGPT真的太朴素了）。背后其实反应的是ChatGPT的能力确实强大。

有点扯远了，不过大家可以发现语音输入是基本的一个功能，毕竟是讯飞的一个强项。

而且敢现场演示，还是挺勇的。

3.语言理解

毕竟叫做“认知大模型”了，也就是说星火对语言理解还是很有信心的，关于语言理解，一些例子：

为了防止实现设计好了问题，也请现场嘉宾提问了（没截屏）

主持人：遥遥领先于国内同行（

4.开放域问题域打假

开放域问题算是大模型必备的能力，但是给的例子很好：

据说模型在一些打假网站、科普网站数据、一些专业科学资料等资料上进行了训练，感觉挺不错的

5.逻辑推理和数学能力

现场做题做错了，说明确实是现场演示的。

就大模型来说，这个数学和推理能力已经很不错了。

解方程能力还不错，不知道时不时有借助外部工具（没有的话已经很厉害的）

现场做题做错了，说明确实是现场演示的

6.图生图？！

这个真的有点厉害。

众所周知，GPT-4输入是多模态，文心一言输出是（缝合怪）多模态，这个能做到图生图，也能做图像问答，挺好的。

当然，是不是也是缝合就不清楚了。

好像也是目前不开放，sad

虚拟人、语音输出之类的肯定是缝合进去的，就不展示了。

7.画饼

饼，大家自己看吧

8.现场收集问题

可恶，手慢了，没扫上码（毕竟边直播边写这一篇专栏）。

现场收集后现场抽题回答了，大家问的问题挺有意思的

这说明讯飞确实对模型很有信心的。据说现场的人都能看，说明确实没托（然后全是托）

9.接地气的应用

emmm，批改作业，这真的接地气啊。（当然，这个应用用了OCR[OCR也是讯飞的强项]，然后过大模型，开发难度没有特别高，不过这个想法真的挺好的）

然后带货，乐。

后面是产品、开发者相关等。不写了。

10.总结

整体来说，现场演示之类的，说明讯飞对模型还是有信心的，也比较真诚。

不过还是那句话，具体性能如何还是需要亲自体验。（所以什么时候给我资格）

相关资讯

近期资讯

面试官：如何使用 babel 进行项目优化

简介 Babel 是一个广泛使用的 JavaScript 编译器，Babel 是一个强大的 JavaScript 编译器，主要用于将现代 JavaScript 代码转换为向后兼容的版本，并支持其他语言

Dcc 2024-12-28

2张图彻底搞懂拖拽+缩放demo

今天让你看完图，彻底搞明白实现一个拖拽+缩放的功能，用到了那些属性，本文只是自己画图的一些心得，分享一下，也是下次遇到时忘了再翻翻时的笔记

猿小猿 2024-12-28

node.js项目构建问题及解决

今天在编译构建一个 node.js 项目时，在构建过程中遇到了一些问题，本文将记录问题及对应的解决方案。

overstarry 2024-12-28

混合渲染模式：SSG 与其他技术的结合

现代前端开发中，SSG（Static Site Generation，静态网站生成）是一种前沿的技术理念。它在网站开发、构建与部署中占据着重要地位，尤其是在提高性能、SEO 优化、降低服务器压力等方面

汪子熙 2024-12-28

快速实现一个标准的NFT合约（实操篇）

前言同质化代币和非同质化代币程序层面的区别 ERC20:mapping(address=>uint)//地址指向余额 ERC721:mapping(uint=>address)//id指向地址开发

木西 2024-12-28

【Next.js】001-项目初始化

【Next.js】001-项目初始化 [toc] 一、前言首先，让我们学会创建一个 Next.js 项目！Next.js 提供了开箱即用的 create-next-app脚手架，内置支持 TypeS

訾博ZiBo 2024-12-28

现代前端开发中的 ISR 概念及其实际应用

现代前端开发中的 ISR（Incremental Static Regeneration，即增量静态再生）是一种用于优化网站性能的技术，尤其适用于内容密集型的网站。它结合了传统静态站点生成（Stati

汪子熙 2024-12-28

多选不再难：探索 Checkbox 设计的最佳实践

Checkbox&CheckboxGroup Checkbox:提供多选框组件，通常用于某选项的打开或关闭。 CheckboxGroup:多选框群组，用于控制多选框全选或者不全选状态。 1. Chec

梁林烁 2024-12-28

从零开始：构建高效的 TextInput 用户界面

TextInput&TextArea 每天一个知识点，点点不一样。今天我们一起来学习输入框，多的不说少的不唠，立马开始。 1、TextInput 1.1概念 TextInput、TextArea是输入

梁林烁 2024-12-28

不是哥们🤡，滚动动画你还需要用库和JavaScript😱？两行CSS实现，颠覆你的认知

作为前端工作人员，滚动动画大家再也熟悉不过。不过很多前端工程师对于这块的实现是头疼的。这里我准备了iphone16官网来作为例子，https://www.apple.com/iphone-16-p

Embrace 2024-12-28

【花师小哲】鉴定网络热门（？）AI（10）——讯飞星火模型发布会小总结

推荐体验

相关资讯

【花师小哲】鉴定网络热门（？）AI（5）——百度文心一言发布会小总结

【花师小哲】鉴定网络热门（？）AI（6）——Prompt

【花师小哲】鉴定网络热门（？）AI（4）——多模态大模型

【花师小哲】鉴定网络热门（？）AI（2）——ChatGPT篇（2）

【花师小哲】鉴定网络热门（？）AI（14）——合成数据

近期资讯

面试官：如何使用 babel 进行项目优化

2张图彻底搞懂拖拽+缩放demo

node.js项目构建问题及解决

混合渲染模式：SSG 与其他技术的结合

快速实现一个标准的NFT合约（实操篇）

【Next.js】001-项目初始化

现代前端开发中的 ISR 概念及其实际应用

多选不再难：探索 Checkbox 设计的最佳实践

从零开始：构建高效的 TextInput 用户界面

不是哥们🤡，滚动动画你还需要用库和JavaScript😱？两行CSS实现，颠覆你的认知

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响