【AI小杂谈】我已经看腻了的大模型论文中常见话术或行文结构

作者：花师小哲-中二发布时间：2024-01-28

大语言模型 GPT-4

简单总结下我自己看大语言模型（LLM）论文常见（我已经看腻了）的话术和LLM论文自身的写作模板。

1.自动评估难、人工评估贵，所以我们用LLM评估LLM/自动标注难，人工标注贵，所以我们用LLM标注数据

2.我们的模型性能达到GPT-3.5的水平，但是还不及GPT-4/我们的模型在部分指标下甚至能和GPT-4一样甚至更好

（啊，没错，其实很多模型真的就是奔着在某一方面刚好比GPT-4差一点去的，因为如果真的在这方面超过，往往意味着泛化性能会差到不能看）

3.经过我们的评估，GPT-4表现最好，GPT-3.5次之...（基本所有评估都是这个结果，GPT-4还是强的啊）

4.框架：我们需要提升LLM在某个领域上的表现，所以我们用LLM（早期是GPT-3.5，现在基本都是GPT-4了）处理数据，然后微调

5.对于CoT/ICL/few-shot来说，示例的正确与否并不是影响性能的最主要因素，关键在于示例的结构以方便LLM识别任务

6.SFT阶段重要的数据复杂度、质量与多样性，而不是数据数量

7.GPT-4虽然表现良好，但是距离人类水平依然有些差距

8.框架：虽然LLM很多，但还有领域没有探索，所以我们做了benchmark

9.LLM的偏见、幻觉等问题留作未来研究

10.参数量达到XX才有XX现象（涌现）

之后可能会在评论区进行补充（每一篇专栏最多修改3次）

相关资讯

【花师小哲】杂谈——大模型和小模型杂谈

浅谈一下大模型与小模型，也是师兄昨晚在群里发表了一些看法，于是我也来写一点。个人看法。直接上结论：大模型要发展，小模型也要发展（1）首先我们要承认大模型确实在很多地方表现出了强悍的能力。并且，我们还可以通过提示工程或加配件等方式进一步提升性能，甚至已经有办法往里塞多模态了。ChatGPT显示出来的另一个很惊艳的优势是它可以记住上下文并根据反馈来修改答案。关于自然语言理解、世界知识等能力也不多说了，能够一下子超越大部分的模型。并且，事实是大模型已经在很多场合进行应用了，ChatGPT本身也是非常成功的开放域

ChatGPT

花师小哲-中二 2023-03-22

什么? chatgpt 居然告诉我 JS 中常见的继承方案有十种？

继承是面向对象编程中讨论最多的话题, 在 JS 中继承主要是通过原型、原型链实现的, 为了了解更多关于 JS 继承的细节, 我问了 chatgpt 如下问题……

ChatGPT 编程

墨渊君 2023-05-24

机器学习面试中常见问题整理

机器学习（ML）作为目前一个比较火领域，提供了许多有趣且高薪的工作和机会。无论你是刚刚踏入机器学习领域的新手，还是已经积累了一定经验的从业者，面试都是检验你技能和知识的重要环节。本文将梳理一些常见的

机器学习

databook 2024-03-11

ChatGPT提升工作效率技巧-6：新一代科研论文撰写利器，以及撰写中常见的误区

内容提要如何使用ChatGpt 撰写科研论文科研论文写作中关于ChatGPT的常见误区推荐一个专业撰写论文的ChatGPT服务其他相关文章深度体验ChatGPT，内有体验链接与方法，手机电脑端均可使用ChatGPT深度体验- 1，高效处理工作学习中的邮件、会议记录ChatGPT深度体验-2，和ChatGPT一起高效写代码ChatGPT 深度定制优化版(含图片)体验指南ChatGPT深度体验-3, 工作中与ChatGPT一起玩转ExcelChatGPT提升工作效率技巧-4， HR 如何使用 ChatGPT

ChatGPT 编程

轻松Ai享生活 2023-04-18

直播带货七大类「话术技巧」,ChatGPT帮你智能写话术？

以下是直播带货常见的话术，新人小白不知道怎么开场写话术、介绍产品的，看过来~！说到直播带货，想必大多数人都想到了李佳琦“OMG，买它，一定要买它”以及薇娅直播间万年开场白““废话不多说，我们先来一波

ChatGPT

飞瓜智投 2023-02-24

近期资讯

FOTRIC 246M 热像仪微距套装

FOTRIC 246M 热像仪微距套装探索热成像技术的尖端之选，FOTRIC 246M系列热像仪微距套装专为教育科研领域的需求而量身打造。我们采用全球领先的硬件配置，包括红外探测器、主处理芯片、FPGA和电源芯片，确保热像仪在品质、性能和稳定性上都能无与伦比。这款热像仪灵敏度高达0.05℃，让您对温度变化的感知更加细腻，投射准确的测温结果，助力科研实验的精准需求。更值得一提的是，我们提供多种微距镜头（50μm和100μm），让您轻松获取芯片温度，捕捉微小的温度变化，开拓研究的新视野。我们充分考虑到

坚领科技 2024-09-26

坚领科技 2024-09-26

vivo X200标准版新配色曝光，采用水纹云阶设计

9月26日，vivo通信技术有限公司产品经理韩伯啸在社交平台分享了vivo X200标准版的全新配色。虽然没有明确公布具体的配色命名，但从色系来看，该机至少会推出蓝色和白色的版本。目前可以确认的是，vivo X200标准版后摄模组将采用水纹云阶设计，整体的摄像头排布延续上代造型，闪光灯位于云阶之外，设在后盖右上角的位置。不同之处在于，搭配新的配色工艺，vivo X200标准版机身后盖可呈现微波纹理，在不同角度不同光线下有深浅不一的色彩观感。除了标准版，vivo X200系列中的小屏机型同样备受关

ZAEKE知客 2024-09-26

国产系统电脑替代难题：如何解决办公软件不兼容问题？

随着国家信创战略的深入推进，党政机关、央国企等单位正在加速采购国产CPU和操作系统的办公电脑。然而，很多企业在替换Windows系统电脑时，遇到了办公软件不兼容的严重问题，影响了日常工作进程。这一问题不仅影响了办公效率，也阻碍了信创国产替代的推进。如何解决这一挑战？可以采取以下三步解决方案： [图片] 1、列出不兼容软件清单，反馈给开发商政企可以将不兼容的办公软件列成详细清单，并反馈给相关的软件开发商。通过邮件、论坛发帖或直接致电反馈，明确说明问题并要求推出兼容国产系统和CPU的版本，以促使开发商根据

信息安全分享 2024-09-26

80例！高中化学常考实验现象合集。

1.镁条在空气中燃烧：发出耀眼的强光，放出大量热，生成白烟同时生成一种白色物质。2.木炭在氧气中燃烧：发出白光，放出热量。3.硫在氧气中燃烧：发出明亮的蓝紫色火焰，放出热量，生成一种有刺激性气味的气体。4.铁丝在氧气中燃烧：剧烈燃烧，火星四射，放出热量，生成黑色固体物质。5.加热试管中碳酸氢铵：有刺激性气味气体生成，试管上有液滴生成。6.氢气在空气中燃烧：火焰呈现淡蓝色。7.氢气在氯气中燃烧：发出苍白色火焰，产生大量的热。8.在试管中用氢气还原氧化铜：黑色氧化铜变为红色物质，试管口有液滴生成。9.用木炭粉

西西学长爱学习 2024-09-26

5G-A和F5G-A，对于AI意味着什么？

2024年已经过去了一大半，风起云涌的AI浪潮，又发生了不小的变化。一方面，AI大模型的复杂度不断提升，模型参数持续增加，智算集群的规模也随之增加。万卡级、十万卡级集群，已经逐渐成为训练标配。这对智算网络的性能和可靠性提出了更高的要求。另一方面，厂商们逐渐意识到，AI大模型应用能否成功落地、商业模式能否跑通，在当前阶段具有更现实的意义。AI想要获得成功，必须有贴合用户需求的应用场景，解决用户痛点，带来显著的体验改善。在落地过程中，端侧AI成为新的热点，而如何确保“云-边-端”智算算力协同，同样给通信技

鲜枣课堂 2024-09-26

网站建设教程,从零开始打造你自己的专业网站

你是否曾经为自己或者企业需要一个专业的网站而感到困惑？你是否觉得网站建设对于一个小白来说太过复杂，无从下手？别担心，今天我就来为大家介绍一款简单易用、低成本、开发速度快、模板多的建站产品——小凡优选。浏览器搜索【小凡优选】，在线体验一、建站实用场景无论你是个人博客、电商平台还是企业官网，小凡优选都能满足你的需求。对于个人而言，你可以通过搭建一个个人博客来记录生活、分享经验、展示作品。对于电商平台来说，小凡优选提供了丰富的电商模板和功能，帮助你快速搭建一个专业的在线商城。而对于企业而言

右以云 2024-09-26

Creo如何快速选择四周的棱边

[图片] 如上图，鼠标右键，弹出对话框，选择对应的边即可

煮酒论星辰 2024-09-26

【AI小杂谈】我已经看腻了的大模型论文中常见话术或行文结构

推荐体验

相关资讯

【花师小哲】杂谈——大模型和小模型杂谈

什么? chatgpt 居然告诉我 JS 中常见的继承方案有十种？

机器学习面试中常见问题整理

ChatGPT提升工作效率技巧-6：新一代科研论文撰写利器，以及撰写中常见的误区

直播带货七大类「话术技巧」,ChatGPT帮你智能写话术？

近期资讯

FOTRIC 246M 热像仪微距套装

AI智能体“情智双优”，专治人类emo？

DLIA深度学习系统，工业缺陷检测的得力助手，保障质检的关键力量

FOTRIC 248M 热像仪微距套装

vivo X200标准版新配色曝光，采用水纹云阶设计

国产系统电脑替代难题：如何解决办公软件不兼容问题？

80例！高中化学常考实验现象合集。

5G-A和F5G-A，对于AI意味着什么？

网站建设教程,从零开始打造你自己的专业网站

Creo如何快速选择四周的棱边

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响