陶哲轩：ChatGPT已加入我的数学工作流

作者：量子位发布时间：2023-03-11

ChatGPT

Pine 梦晨发自凹非寺

量子位 | 公众号 QbitAI

ChatGPT，已经成为天才数学家陶哲轩的 研究助手了！

不止ChatGPT，他还直接在网上宣布：

多种AI工具都会纳入自己的工作流。

最近这些日子，陶哲轩对AI可是青眼有加，甚至在网上只谈论一个话题： AI，特别是大语言模型在数学研究中的应用。

期间，各种ChatGPT的“隐藏功能”都被陶哲轩挖了出来：

大到寻找公式、辅助证明定理；小到改写论文语句、查询小语种数学名词的发音。

而为何突然对AI协助工作这么关注？陶哲轩用自己的老本行数学对AI做了个类比：

传统的计算机软件就像是数学中的 标准函数，比较死板；

AI工具更像是数学中的 概率函数，会更加灵活。

对这个类比，中科院计算所研究员包云岗直接称赞 很形象。

也有网友表示：

AI生成的内容有时候真的会有“神来之笔”，帮助人们更好地工作。

不过也有网友对陶哲轩用ChatGPT协助搞数学研究接受无能，毕竟之前很长一段时间大众对ChatGPT的吐槽都集中在数学能力上。

于是，在陶宣称ChatGPT在数学中可以完成一些半成品工作时，有人直接在评论区发问：

你是认真的吗？我可是（你的）超级粉丝。

那话说回来，一个“数学菜鸡”ChatGPT在一个大数学家手里究竟能有什么用处？

一起来看～

ChatGPT对搞学术的来说“刚刚好”

总的来讲，陶哲轩大概的意思就是：

ChatGPT数学能力虽然不咋滴，但对做学术研究的人来说是个 发散思维的好工具。

（对普通人来说有点不太专业，但对搞数学的学术人员来说刚刚好）

那这个 刚刚好的尺度ChatGPT是如何拿捏的？

陶哲轩直接给出了他用ChatGPT求解数学题的几个示例：

刚开始，他直接把同事询问的问题逐字逐句抛给了ChatGPT。

ChatGPT也有模有样地回答了起来，期间还提到了一个高度相关的术语： 对数矩生成函数，甚至在给出的答案中还讨论了一个具体的例子。

这术语，这举例…乍一看，甚至骗过了陶哲轩的“法眼”，不过在检查一遍之后，陶发现：

答案是错的！

Emmmmm，按理说一般人的逻辑到这里就该结束了——得出结论：ChatGPT的数学能力不太行。

但陶哲轩还没有止步，他仔细分析了ChatGPT给出的解答过程，发现 并不是完全错误的，还是有可取之处。

比如说，ChatGPT在解答过程中用的是lmgf公式，而在克拉默定理给出的标准答案中用到的是lmgf公式的Legendre变换。

虽然不是正确的解题思路，但也很接近正确答案了。

（有点意思）紧接着他又用儿子帮忙做的ChatGPT手机短信版再试了一个数学问题：

我该 如何证明有无穷多个素数？

虽然给出的证明的是意料中的 不完全正确，但陶发现ChatGPT给出的论证思路是可以被固定下来的，并且这个思路他之前还 从未见过。

这一通试用下来，直接打开了陶哲轩的思路。

既然ChatGPT在具体数学问题上给出的答案是 不完全正确的，那不如索性发挥发挥它生成答案 部分正确的特性：

在处理数学问题时，可以让ChatGPT这类大语言模型做一些 半成品的语义搜索工作。

也就是说，ChatGPT不用提供确切的答案，只用生成一些可能的提示（类似于帮你找灵感balabala）。

这样一来，依据ChatGPT生成的提示+传统搜索引擎搜索，就能很轻松找到答案了。

随后，陶哲轩还具体上手演示了一把。

首先要有技巧地抛出一个问题，假设陶想找库默尔定理但记不起来这个定理的名字，他是这样来问的：

我正在找一个关于（balabala）的公式，它是一个经典的理论但我想不起名字，你能给我解答吗？

最终ChatGPT给出的答案是Legendre公式（一个相关的结果），然后根据这个答案用传统的搜索引擎就可以轻松找到库默尔定理。

话说回来，既然都只是用作数学研究中的一个工具，为啥在陶哲轩眼中AI会更合适，而传统搜索引擎就不太行呢？

AI“思维逻辑”更发散

陶直接从传统计算机软件和AI工具的 内部运行逻辑分析了一通。

先来说 传统的计算机软件，它的运行逻辑类似于 函数𝑓:𝑋→𝑌，这是一个很标准的数学概念。

具体来说，若输入的𝑥在给定域𝑋中，软件就能够可靠地给出范围𝑌中的单个输出𝑓(𝑥)，若输入𝑥不在给定域𝑋中，则就不能给出结果或者说乱给一些结果。

而 AI工具，就不会像传统计算机软件那样死板，它运行的逻辑不是基于经典函数，而是类似于 概率 kernel μ:𝑋→Pr(𝑌)。

输入𝑥，AI会从一个概率分布μₓ中采样，然后随机输出。而这个概率分布，集中在完美结果𝑓(𝑥)附近。

不过这样也会导致一些随机偏差和不准确结果的产生。

但整体比较下来，AI工具还是具有一定的优势。

一方面它更加灵活，可以比传统的软件工具更优雅地处理嘈杂或格式不好的输入𝑥。

另一方面，在一定程度上AI的“思维方式”也会更加发散。

在宣布把AI工具纳入自己的工作流之后，陶哲轩还在mathstodon上不断更新用AI工作的帖子。

比如说用AI写邮件：

AI半自动证明定理，审稿人难了

陶哲轩对AI的观察，也在学术圈引起了一场讨论。

他指出，阅读AI写的论文和人写的论文体验完全不同。

阅读人写的论文，通常能在上下文和风格上捕捉到一些线索，通过这些线索可以快速分离出论文的“肉”，加快阅读速度。

AI生成的数学论文，文字看起来都很有说服力，必须一行一行仔细看才能发现其中的缺陷。

纽约大学教授马库斯将其解读为：同行评议从此更难了。

不过网友中也有人认为，让审稿人必须一行一行仔细看，而不是依赖于肤浅的格式信号，也算得上一件好事。

还有人脑洞大开，想知道AI能否提出一些全新的数学猜想。

AI能不能提出猜想不知道，但是AI自动、半自动证明定理已经是现实，并且走向实用化了。

还是陶哲轩，2月份他在加州大学洛杉矶分校的IPAM（纯数学与应用数学研究所）组织了一场机器学习辅助证明主题研讨会，会上展示了很多这方面的前沿成果。

IBM研究员Jason Rute展示了一种受AlphaGo启发的方法，将定理证明类比成围棋，下一个步骤相当于下一手棋，得证相当于获胜。

谷歌科学家吴宇怀则分享了大语言模型在自动形式化（Autoformalization）上的进展。

而陶哲轩本人对AI的兴趣也不止于此，用机器学习解决实际问题也在他的涉猎范围之中。

刚刚在澳大利亚的一场讲座上，他还分享了如何用数学结合机器学习预测火灾变化。

— 完—

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办，峰会将邀请AIGC产业相关领域的专家学者，共同探讨生成新世界的过去、现在和未来。

峰会上还将发布 《中国AIGC产业全景报告暨AIGC 50》，全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情：

被ChatGPT带飞的AIGC如何在中国落地？量子位邀你共同参与中国AIGC产业峰会

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

推动“5G+工业互联网”规模应用

12月12日，江西省抚州市崇仁县高新技术产业园区的一家电力科技企业，工人在加工新型输变电设备。近年来，当地鼓励企业运用“5G+工业互联网”进行设备更新、技术革新、科技创新，引领企业从“制造”向“智造”升级。

中国战略新兴产业 2024-12-27

“AI界的拼多多”DeepSeek发布新模型

12月26日晚间，杭州深度求索人工智能基础技术研究有限公司（以下简称“深度求索”）宣布，全新系列模型DeepSeek-V3首个版本上线并同步开源。

澎湃新闻 2024-12-27

扬子晚报 2024-12-27

实测耐用战神OPPO A5 Pro：防水/抗摔/不怕冻

相信大家不难发现，身边朋友换手机的周期越来越长，由此耐用性也成为更多用户的关注点。而关于耐用性，大家应该很容易联想到防水、抗摔等多个关键字。

IT168 2024-12-27

Precor必确打造高端商用椭圆机，引领有氧健身新潮流

椭圆机的设计特性相较于其他有氧器械,更能有效维护关节,预防运动伤害。Precor必确商用椭圆机易于清洁维护,配备封闭式坡道、后部驱动箱和活动状态指示灯设计。

中国财富网 2024-12-27

画质最炸裂？海信的超画质Mini LED凭什么能和高端OLED平起平坐

不知道小伙伴们有没有发现一个神奇的事情，那就是双十一、国补环境下大屏MiniLED电视销量持续领先。据奥维云网数据显示，国内市场MiniLED电视销量更是较同期增长超7倍。答案非常简单，就是MiniLED技术相较于OLED技术，具有峰值亮度高、环境光对比度高、使用寿命长等优势，但也普遍存在可视角度小、有光晕等问题。

王晓川 2024-12-27

小米澎湃OS 2更新加入新的AI助手超级小爱

动点科技 2024-12-27

当科研撞上市场刚需：高等学府与企业的双向奔赴｜甲子引力

新技术成功转化并非一蹴而就，而是无数次的沟通、试验和改进的结果，也为其科学家们志于将科研成果“落地生根”的团队树立了范例。随着更多高校与企业间的合作逐渐加深，越来越多的科学研发之花将为产业发展注入崭新活力，让智慧的种子在更广阔的土壤里茁壮成长。

甲小姐甲子光年 2024-12-27

陶哲轩：ChatGPT已加入我的数学工作流

推荐体验

相关资讯

陶哲轩：计算机辅助数学证明的历史

“数学天才”陶哲轩也爱上 GPT-4：节省了大量繁琐工作

数学天才陶哲轩：GPT-4无法攻克一个未解决的数学问题，但对工作有帮助

陈根：华裔“数学天才”陶哲轩接任白宫生成式AI工作组的共同领导者

华裔数学家陶哲轩领导白宫生成式AI工作组，李飞飞将在小组演讲

近期资讯

推动“5G+工业互联网”规模应用

“AI界的拼多多”DeepSeek发布新模型

小米澎湃秒充协议全面开放

2025鸿威·世界动漫游戏产业博览会举办：IP授权跨界引领产业升级，专家热议合作“出海”

「宠己」成支付宝年度关键词：百万人花式攒钱、千万人提前备老、超1亿人用AI办事

实测耐用战神OPPO A5 Pro：防水/抗摔/不怕冻

Precor必确打造高端商用椭圆机，引领有氧健身新潮流

画质最炸裂？海信的超画质Mini LED凭什么能和高端OLED平起平坐

小米澎湃OS 2更新加入新的AI助手超级小爱

当科研撞上市场刚需：高等学府与企业的双向奔赴｜甲子引力

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响