通义千问对战文心一言，谁更胜一筹？记者实测报告来了

作者：金融界发布时间：2023-04-09

通义千问文心一言

阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试，用户可通过官网申请，符合条件的用户可参与体验。

而《科创板日报》记者第一时间拿到了内测码。此前，记者也曾体验过文心一言，此次将把两者的问答情况进行对比。

在测试过程，通义千问和文心一言各有擅长的地方，但也闹出一些哭笑不得的乌龙。比如文心一言声称：通义千问是百度研发的大模型。

首先，《科创板日报》提出了一个常见问题：你和ChatGPT的区别是什么？

“通义千问”的回答：

文心一言的回答：

相比文心一言，通义千问显然更详细地强调了自身的优势，“自吹自擂”了一番。

那么，通义千问跟文心一言谁更强呢？

通义千问的回答：

文心一言显然还没有对” 通义千问”进行特定的识别，居然认为“通义千问”是百度研发的大模型。

既然通义千问在优势中强调了代码写作能力，记者也进行了测试。

提问：我需要一段冒泡排序java代码

通义千问：

文心一言：

提问：画椭圆形的JS脚本

通义千问：

文心一言：

记者同样让程序员朋友检查了下，对方表示：在画椭圆形的JS脚本方面，文心一言给的似乎更准确。通义千问画的是圆形。

我们曾向文心一言询问关于国内涉足预训练大模型的公司有哪些？文心一言回答了7家企业和机构。

“通义千问”回答了5家，主要列举了企业，没有列举社会机构。在企业方面，比文心一言多补充了商汤科技。但是，把商汤预训练语言模型的名称写成了“文心一言”。

此前，记者曾向文心一言提问了一个涉及信息搜索的问题：

特斯拉在国内过去五个月、过去一年的销量是多少？

文心一言的答案不尽如人意。这次记者重新提问，文心一言仍然没有准确理解5个月，以及过去一年的含义，提供的数据也较为陈旧。

而通义千问把特斯拉从2021年5月到2022年12月的数据都列举了出来，在问题理解上比文心一言表现更好，但数据准确性仍待考证。

从记者的初步搜索来看，根据乘联会发布的2021年5月的新能源汽车销售数据，特斯拉中国的销量为33463辆。

于是，记者又针对比亚迪的销量进行提问：

两者都没有给出准确答案。特别是文心一言的数据偏差较大。

文心一言称：2022年11月，比亚迪新能源汽车销量为28847辆，而根据比亚迪公布的2022年11月产销报告，当月新能源汽车销量23.04万辆。

相比之下，通义千问则坦率承认：无法提供具体销量数字。

接着，《科创板日报》记者考验了通义千问的文学创作能力，让其模仿三体风格写一篇800字的科幻小说，基本完成了任务。

通义千问的回答：

文心一言：

记者也让通义千问写一首“祝你生日快乐”的藏头诗，它理解了“藏头”的含义，但不知为何只写了“生日快乐”的藏头诗，少了“祝你”。

通义千问：

文心一言：

然后，记者试了试通义千问在商业文案创作方向的能力。

之前，记者曾让文心一言写一段针对双11促销的童装营销文案，并设定了“用料健康、性价比高”的关键词。

当时文心一言的回答：

而通义千问的问答：

显然，文心一言在营销词语的运用上更胜一筹，通义千问对“用料健康、性价比高”的优势没有进行详细解读。

记者继续让其生成针对AI医疗公司的中秋节海报文案

通义千问的回答：

文心一言：

从答案来看，两者都算完成了任务。不过，文心一言同样对医疗进行了更多的阐释。

写工作总结是一件令人头疼的事。记者此前也提问了文心一言。

通义千问也给出了回答，相比文心一言，多了“此致敬礼”等结束语。

不过，记者再次测试文心一言时发现。它对问答进行了优化，相比过去直接给出工作总结，如今文心一言会追问：您的季度总结关注哪些方面？

记者尝试从外国人的汉语等级考试卷子里，找了几道题，看通义千问能否理解中文的语义。

羊毛衫减价啦，件件10元，样样10元。请问：什么10元

文心一言答对了这个问题。

而通义千问表示：缺少更多上下文。

提问：李明是李丽的哥哥，刘云是李丽的妈妈，李明是刘云的谁？

这次通义千问和文心一言都答对了。

通义千问：

文心一言：

在数理逻辑推算能力方面，文心一言顺利答对了鸡兔同笼的经典题目，而通义千问没有答对。

鸡和免放在一只笼子里，上面有 29 个头，下面有 92 只脚。问: 笼中有鸡、兔各多少只？正确答案是：12只鸡，17只兔。

通义千问：

文心一言：

记者再次提问数学题：

某次数学竞赛共 20 道题，评分标准是: 每做对一题得5分，每做错或不做一题扣1分。小华参加了这次竞赛，得了 64分。问:小华做对几道题？

正确答案应该是14题。此前文心一言没答对，通义千问倒是列对了公式，但不知为何，依然计算错误。

通义千问

文心一言

目前，通义千问还仅支持自然语言处理，尚不支持文生图等跨模态功能，不过记者从知情人士处了解，后续也会尽快推出相关大模型，能够支持更多功能。

通义千问尚不支持AI绘画。

来源：科创板日报

近期资讯

存10万一天赚不到4元！余额宝收益率跌跌不休一年之间腰斩

据Wind统计，截至12月30日，全国市场364只货币基金（仅初始基金）的平均7日年化收益率为1.48％，相比年初的2.34％回落了多达86个BP。进入12月份，多只基金的收益率更是创下新低。规模最大的

上方文Q 2024-12-31

《守望先锋》国服官网上线：代码曝光回归时间！

快科技12月31日消息，没想到，2024年最后一天，《守望先锋》国服官网正式上线，目前可以正常使用国服战网账号登陆。官网首页为“好久不见，欢迎回家”的标语，下方则是英雄的介绍。

拾柒 2024-12-31

4万多人在线看肥娟一块一块数钱：营业额再创新高

12月31日消息，据媒体报道，此前有一家暖心鞋店引发全网关注，店主夫妇因“收留”了不少下课来看电视的孩子们受到关注。店老板介绍，童鞋店开在一家小学附近，每天放学后都会有很多

振亭 2024-12-31

泪奔！韩国客机失事最惨一幕：1家9口空难离世家仅剩狗

12月31日消息，当地时间12月29日，一架韩国济州航空7C2216航班的客机在位于韩国全罗南道的务安机场着陆时，偏离跑道后撞上机场围墙。除2人获救外，机上其余179人全部遇难，这是在韩国国内发生

雪花 2024-12-31

Windows本地AI开发神器！微软推出并开源AI Dev Gallery

快科技12月31日消息，微软针对Windows 11 AI+ PC设备推出了一项名为AI Dev Gallery的新功能，旨在帮助开发者在其应用中融入端侧AI功能。该功能已在GitHub上开源，为开发者提供了一个强大的本地

黑白 2024-12-31

印度成功发射两枚卫星，将开展空间交会对接试验

据央视新闻12月31日报道，当地时间30日，印度极地卫星运载火箭（PSLV）搭载两枚卫星升空，为印度尝试空间交会对接任务拉开序幕。《印度斯坦时报》援引印度空间研究组织消息报道，这次发射升空的两枚卫星将用于印度“空间对接试验”（SpaDeX）任务，该任务旨在发展并展示航天器在近地轨道交会对接以及分离所需技术。

澎湃新闻 2024-12-31

知名投资人：英伟达正在“印钱” AI机遇无穷无尽！

“AI总龙头”英伟达的股价确实在年末这段时间遭受了一些挫折，但站在2024年的最后一天展望未来，专家和投资者相信，这家人工智能（AI）市场的宠儿即将迎来新的篇章，以及更令人印象深

2024-12-31

我国开建全球最大万吨级纯电动运输船：续航可达500公里

快科技12月31日消息，据央视新闻报道，日前，全球最大的万吨级纯电动运输船在湖北宜昌开工建设。该船是三峡集团所属长江电力三峡电能牵头、国内多家科研单位参与的重点项目，是我国万吨级

若风 2024-12-31

年末新机大战打响：补贴与降价齐飞，争夺细分市场空间

12月厂商发布的主要为中端价位机型，不过面向中高端市场，记者发现无论是电商平台还是线下渠道，均陆续推出优惠政策，期望为换机再助力一把。

21世纪经济报道 2024-12-31

弃安卓！微信后腾讯重磅游戏宣布适配纯血鸿蒙：华为赢麻

快科技12月31日消息，今天腾讯正式宣布，旗下重磅手游适配纯血鸿蒙系统。今天腾讯旗下热门手游《和平精英》官方宣布正式适配华为HarmonyOS NEXT（纯血鸿蒙）系统，并已开启限量测试。对于玩

雪花 2024-12-31

通义千问对战文心一言，谁更胜一筹？记者实测报告来了

推荐体验

相关资讯

大模型“赶考”，谁更胜一筹？

搜狐科技“实测”：写藏头诗、算“鸡兔同笼”，文心一言与GPT-4谁更胜一筹？

写代码？文心一言or文言文，谁更胜一筹？新工具或许可堪重任

AI写作能力PK！文心一言对标GPT4，谁更胜一筹？

AI写作系统大PK：谁更胜一筹？

近期资讯

存10万一天赚不到4元！余额宝收益率跌跌不休一年之间腰斩

《守望先锋》国服官网上线：代码曝光回归时间！

4万多人在线看肥娟一块一块数钱：营业额再创新高

泪奔！韩国客机失事最惨一幕：1家9口空难离世家仅剩狗

Windows本地AI开发神器！微软推出并开源AI Dev Gallery

印度成功发射两枚卫星，将开展空间交会对接试验

知名投资人：英伟达正在“印钱” AI机遇无穷无尽！

我国开建全球最大万吨级纯电动运输船：续航可达500公里

年末新机大战打响：补贴与降价齐飞，争夺细分市场空间

弃安卓！微信后腾讯重磅游戏宣布适配纯血鸿蒙：华为赢麻

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响