当前位置:首页|资讯

为什么说大模型就像老大爷,“胡说也有理”?

作者:脑呆瓜发布时间:2024-09-25
4 月份,我们实验室主任组织了一场座谈会。在提到科研部分时,我提出可以借助 GPT 等大模型来提高科研效率,有一位同事却反驳说大模型会胡说八道。那时候我使用大模型的次数不太多,虽然知道他说的有问题,但也没有什么好的理由去反驳他。直到最近使用得较为频繁,我才发现我们在使用大模型的过程中可能会存在一些反直觉的东西,影响了我们对大模型的判断,也影响了我们的使用过程。这跟我们过往的教育方式是有一定关系的。
学习的过程仅仅是一步又一步掌握精准知识么?我们上学时,接受的是一步一步学习正确知识的教育,比如今天学 1+1=2,明天学 1×2=2,后天学开根号和一元二次方程等等。但实际上,我们在生活中面临的真实问题与这种模式不太一样。真实生活中没有人替你规划。假如直接让你去解一元二次方程,而你没有足够基础知识,该怎么办?是从 1+1=2、1×2=2 这些基础计算开始学起?图片
如果我们要学习的领域较小,遍历所有知识还比较简单。但如果换成另一个问题,让你去做一个从未接触过的领域的事情,设计一个粒子加速器,怎么搞?我们上学时的学习过程和做事时的学习过程存在一些差异,上学时过于按部就班,以至于面对真实问题时不太适应,而大模型更适合针对具体应用。
设计一个粒子加速器:问村头老大爷还是问清华教授?现在你要真的设计一个粒子加速器,巧的是你们村头有一位老大爷对这个也很感兴趣,经常看各种文章、刷抖音视频。你问他什么,他都能说得天花乱坠,你也能听懂,也觉得自己懂了。但当你去问高中老师时,会发现老大爷说的可能有点问题;再去问清华教授,你会发现高中老师说的也有问题;再问从事粒子加速器研究的人,你又会发现清华教授说的也不对。但如果让你直接问设计粒子加速器的人,先不说能不能见到。就算真的见到,他说的你可能听不懂。图片
“先问老大爷”就是我们利用大模型去思考和解题的过程,他给我们提供一个模糊正确的东西,随着我们逐步深入挖掘,这个模糊的正确会逐渐变成精准正确让他帮忙计算 1+1=?,最开始得到的结果可能是在 0~10 之间。然后继续详细探索,可能就会变成在 1.9~5 之间,再详细一点,就是在 1.95~2.05 等等。当我们进一步深入研究时,这个结果就会变得更加准确。这是一个由粗到细的逼近过程,不是逐步前进的过程。

大模型为什么会“说胡话”?故意的么?当然不是,这跟大模型的内容输出方式有关,大模型不是一个真正的逻辑思考机器,而是一个概率预测机器。我们给它输入大量文本,它会通过计算得到词汇之间的概率,这是训练过程。等到对话时,你输入一句话,它会根据最后一个字输出概率较高的下一个字,然后再逐步输出下一个字,得到最终你看到的结果。图片
就像你早晨起来第一件事情就是去洗漱,但偶尔也会先去洗衣服,也可能会喝水、看手机、读书等等。因为先洗衣服的概率较低,所以在大模型看来,你起床第一件事情大概率是去洗漱。那如果大模型把这个过程准确输出来,会是什么结果呢?
你:“我早晨起来第一件事情干什么?”。它:“你有 99% 的概率去洗漱,还有 1% 的概率去晾衣服,0.02%喝水。。
有点啰嗦,但也还好,毕竟事情类型也不多。
但如果你是国庆想出去玩,问下大模型哪个合适。中国有那么多地方,它如果按照概率给你列出来,没法看,根本没法看。为了保证内容顺畅,大模型会通过模糊的过程带来一个比较接近大概率的结果在它的模型参数里有一个可以调整的温度值,控制概率,但我们实际使用时可能并没有这个选项。
爱说“胡话”,偶尔真话,怎么用才更好?理解了大模型的原理和基本特征后,我们该怎么做呢?我在做内窥镜的调研,要去了解内窥镜的某个技术。第一步我先让大模型用我能理解的方式把相关内容表达出来。在这个过程中,我甚至可以跟它交互,逐步向它提问,这样我对这个东西的理解就会越来越透彻,对内窥镜的整体状况也会有一个了解。基于我之前的知识和新获得的知识,等到我能以80%正确的概率理解它,我就可以继续读论文,利用论文来修正这些模糊的正确,把模糊正确变成正确。我做了一个表格,把快速了解一个领域的问题清单列了出来,逐个询问完,就基本理解了。在这个过程中,也可以先导入一些综述或者期刊论文, 让它在导入文件范围内回答。图片
针对这个表格的问答,花了一个小时不到,我就把这个方向的知识了解了大概,效率远超一篇一篇翻读,而且可以把它当成“村头大爷”来唠。
你:听起来不太靠谱啊,你行么?老大爷:此言差矣,听我解释。

图片

我们做事的时候也是一样的,比如我们想要了解从山东到江苏的整个地貌形态,一种方法是一米一米地往前走,边走边了解。另一种方法是先用飞机从高空飞过,把大概的地貌看一遍,哪里是山,哪里是湖,哪里是公路等等,然后再对这些地型深入探索。你觉得哪种更好?图片
不知道你有没有实际对比过这两种方式的差异,显然这种由粗到细的方式明显更加高效。我们与大模型对话的过程,也可以重新塑造我们对完成一件事情的理解:克服必须精准前进的旧习惯,拥抱由粗到细的新方法

Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1