谷歌Bard整顿AI“乱说”，数学运算能力提升30%，支持表格导入

作者：智东西发布时间：2023-06-13

智东西

编译 | Glu

编辑 | 李水青

智东西6月13日消息，当地时间6月7日，科技巨头谷歌公司对其AI聊天机器人Bard进行了更新，提升了机器人逻辑与推理能力，并增加了表格的导出形式。

Bard是谷歌公司为了对抗ChatGPT和BingChat，在今年3月21日正式推出的一款聊天机器人。此次更新是谷歌继5月新增Bard图片回复功能后的又一次功能迭代，主要针对Bard的数学计算能力，预计能将Bard解决数学问题的能力提高30%。

一、结果的生成：不只靠预测，加入计算力

Bard这次的具体更新内容包括两个方面：

1、提升在数学计算、编码问题和字符串操作方面的能力；

2、提供了一个“到谷歌表格”的新导出选项。有了这个新功能，用户可以将Bard在其回答中创建的表格直接导出到表格中。

在第一项更新中，Bard使用了一种名为“隐式代码执行（implicit code execution）”的新技术，它可以让Bard编写和执行自己的代码。最新版本的Bard识别能根据逻辑代码的提示，在后台编写代码、对其进行测试，并使用结果来生成更准确的回答。

这大大提高了Bard的推理和数学能力，使其有能力解决高级推理和逻辑性较强的复杂问题。如：

15683615的质因数是什么？
计算某人储蓄的增长率
倒写单词“Lollipop”

▲Bard对倒写单词“Lollipop”的回复

Bard之前所使用的LLM（大语言模型）像是一个预测引擎。LLM根据提示，来预测可能进一步出现的词汇，进而生产回复，整个流程并不涉及精细的逻辑推理与计算。因此，他们有能力解决语言类、创造性任务，但却无法准确回答推理、数学等领域的问题。

二、结合大模型与传统代码，准确度提高30%

这项技术的灵感来源是二分法，特别是丹尼尔·卡尼曼（Daniel Kahneman）的双系统思维模型，他认为人的大脑存在两个系统，并称之为系统1和系统2：

系统1是无意识思考，是快速的、直观的、毫不费力的，如一个乐手在演出现场即兴演奏，使用的就是系统1思维；
系统2则需要耗费精力、保持专注，是缓慢的、审慎的，如人们运用数学运算、学习专业乐器演奏时，使用的是系统2思维。

以此类比：

LLM是在系统1思维下运作的——没有经过深度思考，快速产生文本；
传统代码计算方法则与系统2类似——公式化、不灵活，但能产生正确的结果。

以做一道数学题为例，如果只使用系统1，那根本不需要解题方法，直接把想到的答案写出来就行了；但是加上系统2后，便可以运用加减乘除等数学方法去解题。

本次更新中，谷歌结合了LLM（系统1）和传统代码（系统2）的能力，来帮助提高Bard反应的准确性。谷歌称，在他们的内测数据集中，Bard解决计算类问题的准确性提高了约30%。

即使这样，Bard也无法保证回应的绝对准确。Bard不会生成有助于提示响应的代码，它生成的代码可能是错误的，它也无法保证一定将执行的代码包括在其响应中。

结语：各大厂商关注机器人逻辑性，AIGC准确性将继续提高

6月1日，OpenAI宣布ChatGPT数学解题能力将大幅提升，现在，谷歌也宣布了Bard的数学计算能力提高了30%。

这向我们释放了强烈的讯号，即AIGC聊天机器人行业陆续在关注着AIGC解决复杂问题的能力、生成内容的准确性，并不断在以各种方式提升AIGC内容的结构化、逻辑性。未来，我们将享受到能力更强大、结果更准确的AI服务。

来源：Google官网

相关资讯

我们让ChatGPT总结了微软154页GPT-4研报，抽象思考能力优于数学运算｜钛媒体焦点

（图片来源@视觉中国）随着美国OpenAI公司推出的人工智能（AI）对话模型ChatGPT风靡全球，该公司背后核心投资方微软开始评估GPT-4对未来人类的影响。钛媒体App 3月29日消息，微

ChatGPT GPT-4 微软 OpenAI

钛媒体APP 2023-03-29

搜狐科技 2023-05-11

谷歌版ChatGPT支持中文了！Bard实测结果在此

Google官宣了Bard的新版本，支持的语言增加了中文，免不了接受人们的测试。本篇文章从Bard现状出发，详细评价了Bard的各种表现，推荐想了解人工智能的同学阅读。

谷歌 ChatGPT Bard 人工智能

量子位 2023-07-19

谷歌Bard整顿AI“乱说”，数学运算能力提升30%，支持表格导入

推荐体验

相关资讯

我们让ChatGPT总结了微软154页GPT-4研报，抽象思考能力优于数学运算｜钛媒体焦点

6月18日 Llama8B 在数学运算中超越 GPT-4

ChatGPT桌面版新增超30款应用支持旨在提升任务执行和协作能力

谷歌绝地反击：新模型部分能力超GPT-4，Bard将支持中文，打响和微软AI之战

谷歌版ChatGPT支持中文了！Bard实测结果在此

近期资讯

南航C909成功首航广州至文莱航线

机情问答：一加 Ace 5 Pro性能有多凶猛值得入手吗？

AI爆火两年，技术飞快跑，大模型突破商业化困局了吗？

SpaceX上周末“双响炮”，2024年度第134次火箭发射目标近在咫尺

REDMI Turbo 4搭载6550mAh最大小米金沙江电池：首销送五年电池保

《商业观察》2025年新年献词：携手前行，共创未来

我省卫星导航定位服务升级 “北斗三号”差分信号启用

东航第10架C919交付入列

轻松掌握换开关技巧，保障安全并解决常见问题的方法解析

安阳职业技术学院：国际智能服务机器人大赛再创佳绩

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响