ChatGPT 讯飞星火 BingAI HuggingChat编程能力比较

作者：lyyqaqq发布时间：2023-04-30

评分标准：

一、中文支持度（10分）

二、对话轮数（仅计算发送题目后的，次数越多分数越低，满分10分）

三、代码（语言正确10分，编译成功10分，洛谷测评通过10分）

那么，现在开始吧！

首先，告诉几个AI他们的任务

不难看出，除HuggingChat外，其他AI都能流畅的使用中文来回答问题（10分）

HuggingChat需要发送“please answer me in chinese”的指令（0分）

完成后，分别向AI发送编程题目，这里选择的是P1775 石子合并（弱化版）

发送后，除Bing外，其他AI均在下一轮对话中发送了代码（10分）

而Bing回答了：

在明确指出需要提供一个代码后，Bing才开始编写代码（0分）

最后，让我们来看看各家AI的输出结果

ChatGPT：

洛谷评测结果：

ChatGPT还描述了解决此题的算法，时间复杂度及具体思路，这点是值得加分的

（语言正确10分，编译通过10分，洛谷评测10分，共计30分）

Bing AI:

BingAI在输出到一半时歇菜了，直接表示自己不能回答（0分）

讯飞星火

讯飞这边使用了python来解决，而我明确提出请使用C++

洛谷评测结果：

（语言错误0分，编译通过10分，洛谷评测0分）

HuggingChat：

HuggingChat虽然使用了C++，但语法不正确，编译未通过

（使用语言正确10分，编译未通过0分，洛谷评测0分，总计10分）

最后，我们来总结一下各个AI的表现：

ChatGPT稳定发挥，取得满分50分

讯飞星火在理解和上下文衔接方面有所欠缺，取得30分

BingAI在代码编写上有所欠缺，废话略多，取得10分

HuggingChat在代码编写和中文支持上有所欠缺，取得20分

相关资讯

科大讯飞：讯飞星火大模型数学能力方面结果优于ChatGPT

科大讯飞表示，根据系统、科学的评测体系结果，讯飞星火认知大模型数学能力方面结果优于ChatGPT，针对大模型普遍存在的问题，星火大模型有明确的升级迭代里程碑计划，6月9日，星火大模型的数学能力还会再上一个新的台阶。科大讯飞还表示，为更好地助力反诈工作，科大讯飞成立“反诈AI研究所”，在助力公安机关打击防范电信网络诈骗犯罪工作中，依托智能语音等人工智能技术应用，构建“打防宣”三位一体的反诈新格局。6月9日，讯飞星火认知大模型将突破开放式问答，并升级多轮对话能力和数学能力、8月15日将升级代码能力，使得开发者和合作伙伴可以更加高效方便地使用、10月24日将通过科学、系统的评测方法，在通用认知大模型能力上能够实现对标ChatGPT，并在中文上超越，在英文上达到相当水平。(站长之家)

科大讯飞 ChatGPT 人工智能编程

2023-05-26

代码生成超越 ChatGPT，科大讯飞发布智能编程助手 iFlyCode！星火大模型能力再升级

今天，讯飞星火大模型就来兑现升级的Flag，主攻代码能力和多模态能力。北京时间8月15日，科大讯飞于合肥滨湖会展中心举行星火认知大模型V2.0升级发布会，重磅官宣代码能力升级了5项关键能力，除了常见的代码生成与补齐、纠错之外，还有代码解释和单元测试生成。为什么要将代码能力升级摆在第一位？

编程 ChatGPT 科大讯飞

CSDN 2023-08-15

讯飞 “星火”来了！三大能力已超ChatGPT

ChatGPT自发布以来，不仅受到了全球关注，也掀起了认知智能大模型技术发展的浪潮。5月6日，科大讯飞发布了“讯飞星火认知大模型”。活动现场，真机实测的星火不仅展现出跟人类共情的潜力，面对开放式知识问

ChatGPT 科大讯飞

科技白米饭 2023-05-07

科大讯飞董事长：讯飞星火10月实现中文能力超越ChatGPT

5月18日，在第七届世界智能大会上，科大讯飞董事长刘庆峰在现场演讲中谈到了对人工智能技术的看法。刘庆峰认为，目前纯大模型仍存在缺陷，包括无法及时更新知识、事实类问答容易“张冠李戴”、对传统典籍容易出现编造情节等。

科大讯飞 ChatGPT 人工智能

快科技 2023-05-18

科大讯飞星火3.0正式发布能力已超越ChatGPT

据介绍，星火认知大模型V3.0在七大能力（文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力）上均有提升。刘庆峰透露表示，在数学能力上，讯飞星火3.0已经遥遥领先于ChatGPT。他还介绍称，借助讯飞iFlyCode工具，程序员原本需要三个月完成的平台迁移工作，在星火3.0的帮助下，仅用了一个月就完成了。

科大讯飞 ChatGPT 编程

中关村在线 2023-10-24

近期资讯

Python代码精进：工作中学到的12个代码风格

在工作中，我们编写代码时尽可能地使其易于阅读。这意味着以下几点：变量名有意义且更长（而不是 a, b 和 c）函数名有意义且更长许多注释和文档解释代码到处都是类型提示字符串似乎更长、更啰嗦

叶知秋水 2024-12-27

LLLibra146 2024-12-26

uniapp的app与webview的通讯及踩坑记录

由于需要在uniapp开发的app项目中集成游戏，网上查询一些集成的资料得知可以通过webview间接集成，所以就需要学习uniapp项目与webview的通讯

打一拳十块 2024-12-26

Python 项目组织最佳实践：从脚本到大型项目的进化之路

在 Python 开发生涯中，相信很多人都是从写简单脚本开始的。随着项目规模扩大，我们会遇到各种项目组织的问题。

Piper蛋窝 2024-12-26

JVM实战—2.JVM内存设置与对象分配流转

大纲1.JVM内存划分的原理细节 2.对象在JVM内存中如何分配如何流转 3.部署线上系统时如何设置JVM内存大小 4.如何设置JVM堆内存大小 5.如何设置JVM栈内存与永久代大小 6.问题

东阳马生架构 2024-12-26

探讨篇（三）：代码复用的智慧 - 提升架构的效率与可维护性

作者：京东物流冯志文背景在分布式架构中，代码复用是个难题。那么如何处理代码功能共享的问题呢？本文结合日常实践中的案例，介绍几种分布式架构中管理代码复用性的技术。包括代码复制、共享代码库（jar包

京东云开发者 2024-12-27

Linux下比ack更快的ag搜索命令详解

简介 ag 命令（The Silver Searcher）是一款用 C 编写的快速且对开发人员友好的文本搜索工具，针对源代码搜索进行了优化。它与 ack 类似，但速度更快，因此深受开发人员喜爱，可用于

唐青枫 2024-12-26

绑定k8s中的PVC和PV

my-pvc.yml my-pv.yml 在 Kubernetes 中，PersistentVolumeClaim (PVC) 和 PersistentVolume (PV) 通常是自动绑定的，前提是

扬光 2024-12-26

ChatGPT 讯飞星火 BingAI HuggingChat编程能力比较

首先，告诉几个AI他们的任务

完成后，分别向AI发送编程题目，这里选择的是P1775 石子合并（弱化版）

最后，让我们来看看各家AI的输出结果

最后，我们来总结一下各个AI的表现：

推荐体验

相关资讯

科大讯飞：讯飞星火大模型数学能力方面结果优于ChatGPT

代码生成超越 ChatGPT，科大讯飞发布智能编程助手 iFlyCode！星火大模型能力再升级

讯飞 “星火”来了！三大能力已超ChatGPT

科大讯飞董事长：讯飞星火10月实现中文能力超越ChatGPT

科大讯飞星火3.0正式发布能力已超越ChatGPT

近期资讯

Python代码精进：工作中学到的12个代码风格

阿里云技术公开课：基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot

工作中对InheritableThreadLocal使用的思考

破解pyfuck代码的背后：如何掌握Python的命名空间与作用域

uniapp的app与webview的通讯及踩坑记录

Python 项目组织最佳实践：从脚本到大型项目的进化之路

JVM实战—2.JVM内存设置与对象分配流转

探讨篇（三）：代码复用的智慧 - 提升架构的效率与可维护性

Linux下比ack更快的ag搜索命令详解

绑定k8s中的PVC和PV

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响