为什么说大模型就像老大爷，“胡说也有理”？

作者：脑呆瓜发布时间：2024-09-25

4 月份，我们实验室主任组织了一场座谈会。在提到科研部分时，我提出可以借助 GPT 等大模型来提高科研效率，有一位同事却反驳说大模型会胡说八道。那时候我使用大模型的次数不太多，虽然知道他说的有问题，但也没有什么好的理由去反驳他。直到最近使用得较为频繁，我才发现我们在使用大模型的过程中可能会存在一些反直觉的东西，影响了我们对大模型的判断，也影响了我们的使用过程。这跟我们过往的教育方式是有一定关系的。
学习的过程仅仅是一步又一步掌握精准知识么？我们上学时，接受的是一步一步学习正确知识的教育，比如今天学 1+1=2，明天学 1×2=2，后天学开根号和一元二次方程等等。但实际上，我们在生活中面临的真实问题与这种模式不太一样。真实生活中没有人替你规划。假如直接让你去解一元二次方程，而你没有足够基础知识，该怎么办？是从 1+1=2、1×2=2 这些基础计算开始学起？

如果我们要学习的领域较小，遍历所有知识还比较简单。但如果换成另一个问题，让你去做一个从未接触过的领域的事情，设计一个粒子加速器，怎么搞？我们上学时的学习过程和做事时的学习过程存在一些差异，上学时过于按部就班，以至于面对真实问题时不太适应，而大模型更适合针对具体应用。
设计一个粒子加速器：问村头老大爷还是问清华教授？现在你要真的设计一个粒子加速器，巧的是你们村头有一位老大爷对这个也很感兴趣，经常看各种文章、刷抖音视频。你问他什么，他都能说得天花乱坠，你也能听懂，也觉得自己懂了。但当你去问高中老师时，会发现老大爷说的可能有点问题；再去问清华教授，你会发现高中老师说的也有问题；再问从事粒子加速器研究的人，你又会发现清华教授说的也不对。但如果让你直接问设计粒子加速器的人，先不说能不能见到。就算真的见到，他说的你可能听不懂。

“先问老大爷”就是我们利用大模型去思考和解题的过程，他给我们提供一个模糊正确的东西，随着我们逐步深入挖掘，这个模糊的正确会逐渐变成精准正确。让他帮忙计算 1+1=？，最开始得到的结果可能是在 0~10 之间。然后继续详细探索，可能就会变成在 1.9~5 之间，再详细一点，就是在 1.95~2.05 等等。当我们进一步深入研究时，这个结果就会变得更加准确。这是一个由粗到细的逼近过程，不是逐步前进的过程。

大模型为什么会“说胡话”？故意的么？当然不是，这跟大模型的内容输出方式有关，大模型不是一个真正的逻辑思考机器，而是一个概率预测机器。我们给它输入大量文本，它会通过计算得到词汇之间的概率，这是训练过程。等到对话时，你输入一句话，它会根据最后一个字输出概率较高的下一个字，然后再逐步输出下一个字，得到最终你看到的结果。

就像你早晨起来第一件事情就是去洗漱，但偶尔也会先去洗衣服，也可能会喝水、看手机、读书等等。因为先洗衣服的概率较低，所以在大模型看来，你起床第一件事情大概率是去洗漱。那如果大模型把这个过程准确输出来，会是什么结果呢？

你：“我早晨起来第一件事情干什么？”。它：“你有 99% 的概率去洗漱，还有 1% 的概率去晾衣服，0.02%喝水。。。”

有点啰嗦，但也还好，毕竟事情类型也不多。
但如果你是国庆想出去玩，问下大模型哪个合适。中国有那么多地方，它如果按照概率给你列出来，没法看，根本没法看。为了保证内容顺畅，大模型会通过模糊的过程带来一个比较接近大概率的结果。在它的模型参数里有一个可以调整的温度值，控制概率，但我们实际使用时可能并没有这个选项。
爱说“胡话”，偶尔真话，怎么用才更好？理解了大模型的原理和基本特征后，我们该怎么做呢？我在做内窥镜的调研，要去了解内窥镜的某个技术。第一步我先让大模型用我能理解的方式把相关内容表达出来。在这个过程中，我甚至可以跟它交互，逐步向它提问，这样我对这个东西的理解就会越来越透彻，对内窥镜的整体状况也会有一个了解。基于我之前的知识和新获得的知识，等到我能以80%正确的概率理解它，我就可以继续读论文，利用论文来修正这些模糊的正确，把模糊正确变成正确。我做了一个表格，把快速了解一个领域的问题清单列了出来，逐个询问完，就基本理解了。在这个过程中，也可以先导入一些综述或者期刊论文，让它在导入文件范围内回答。

针对这个表格的问答，花了一个小时不到，我就把这个方向的知识了解了大概，效率远超一篇一篇翻读，而且可以把它当成“村头大爷”来唠。

你：听起来不太靠谱啊，你行么？老大爷：此言差矣，听我解释。

我们做事的时候也是一样的，比如我们想要了解从山东到江苏的整个地貌形态，一种方法是一米一米地往前走，边走边了解。另一种方法是先用飞机从高空飞过，把大概的地貌看一遍，哪里是山，哪里是湖，哪里是公路等等，然后再对这些地型深入探索。你觉得哪种更好？

不知道你有没有实际对比过这两种方式的差异，显然这种由粗到细的方式明显更加高效。我们与大模型对话的过程，也可以重新塑造我们对完成一件事情的理解：克服必须精准前进的旧习惯，拥抱由粗到细的新方法。

为什么说大模型就像老大爷，“胡说也有理”？

推荐体验

相关资讯

为什么我说国内大模型都是渣渣？

为什么说AI大模型救了云计算的命？

为什么说我们对AI大模型的工作原理知之甚少？

为什么说AI PC是大模型普惠第一终端？

为什么说大模型时代，AI+HPC融合是必然趋势？

近期资讯

汉桑（南京）科技申请室内降噪助眠专利，降低室内噪音助眠

联想家庭存储中枢 T20 开启预售，无盘版 899 元

SpaceX 与美国联邦航空管理局剑拔弩张，马斯克称该局局长需辞职

国内首条智慧型碳纤维导线投用：比普通导线轻 20%，还能实时在线监测

宁波吉森智能科技取得用于面料裁切的拖刀半切装置专利，可适配曲面状面料切割，切割效果好

疑似联想低阶 Legion Go 掌机外壳曝光，采用机身-手柄一体化设计

江苏万乐复合材料取得片料裁剪对折一体机专利，有效解决现有技术中存在问题

惠德印刷取得光控分切机定距裁切机构专利，方便工作人员自由调节切割刀和滑动架的位置，多种规格长度广告布裁切

鼎晟创新发展申请用于写字楼的噪声消除静音箱及其方法专利，克服现有技术声干扰消除的问题

公牛漏电保护 PDU 插座发布：8 孔位、铝合金外壳，131 元起

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响