超越GPT！？又一个史上最强AI大模型来了

作者：GenJi是真想教会你发布时间：2023-12-08

AI大模型

hi~大家好我是genji！今天刚睡醒就被一条突发新闻刷屏了——又一个“史上最强”AI大模型诞生了！(⁎⁍̴̛ᴗ⁍̴̛⁎)所以我就麻溜儿写个专栏和大家说道说道～

先让我们来看一段视频，一个男子做出后仰并躲避的慢动作，AI马上知道：这是表演《黑客帝国》中的“子弹时间”：

当一只手在镜头前不断变化手势，AI也能马上识别手势是在模仿什么东西：

当你寥寥数笔勾勒出一只鸭子，AI会根据水波纹来判断这是鸭子而不是鸟：

当你给鸭子涂上蓝色，AI会吐槽：蓝色鸭子这种玩意可不多见！

让这只小鸭子出现在世界地图上呢？AI甚至会调侃：看来这只鸭子没有地方栖息和找吃的~

这些片段，是谷歌演示最新出炉的AI大模型Gemini的场景。

规模最大、功能最强！？

美国时间12月6日早间，谷歌宣布推出最新AI大模型Gemini，并宣称它比市面上所有人工智能系统都更强大，在测试中连ChatGPT都要甘拜下风。

Gemini针对不同场景有三个版本：Ultra、Pro 和Nano，简单概括：

Ultra - 用于处理高度复杂任务的模型，功能最强、规模最大。
Pro - 用于扩展各种任务的最佳模型。
Nano - 用于手机等设备的最高效模型。

在AI大模型风靡国内外的当下，相信你对于“多模态”这个词已经见怪不怪了。什么意思呢？如果你在跟AI聊天的时候，你们可以无障碍地进行文字、图片、语音等多种交流，那这就是多模态。

和市面上现有大模型相比，Gemini从一开始就被创建为多模态的模型，这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息，包括文本、代码、音频、图像和视频。

除了开头展示的那些，Gemini还可以理解当下最火的emoji合成。

Gemini知道这个emoji是鳄梨+幽灵：

它还给这个合成的emoji起了一个新名字——派对幽灵：

不得不说，这种看起来好像没有多么厉害的小测试，但真的能在一些小可爱小细节的地方戳到你~

超越GPT，超越人类！？

在AI迅速发展的这两年，我们已经看到层出不穷的AI大模型，号称自己刷新了一个又一个“史上最强”。

就在不久前，我在专栏里给大家分享了OpenAI的划时代升级GPT-4 Turbo，没想到这个“史上最强”这么快就又又又被刷新了？

要知道，ChatGPT在大约一年前的横空出世，震动了整个科技行业，也打了谷歌在内一众老牌科技巨头一个措手不及。

谷歌一直在努力开发能与之相抗衡的AI软件，终于在今年3月迅速推出自己的聊天机器人Bard，积极参与AI大模型军备竞赛。而仅仅过了一个月，谷歌便再次宣布：“我们还有更强的杀手锏！”

于是，Gemini应运而生。

那么，这个号称谷歌杀手锏的Gemini强在哪里？

回答这个问题之前，我们要了解一下MMLU测试。这是目前市面上测试AI模型知识和解决问题能力的最常用方法之一，覆盖了基础数学、美国历史、计算机科学、法律等57项知识任务，难度覆盖高中水平到专家水平的人类知识。

谷歌对Gemini作出一系列MMLU测试，并宣称Gemini 在大部分测试中都击败了GPT-4，其中性能最强的Ultra最高得分为90%，超过GPT-4的86.4%。

谷歌还在Gemini官网重点强调——这是史上第一个在测试中超越人类专家的大模型。

有失偏颇，惹来众议……

然而，事情很快有了反转。

Gemini刚刚发布就惹来一众人工智能领域技术专家的质疑：

首先，在与GPT-4 对比测试的时候，GPT-4 用的是few-shot，无提示词技巧、只尝试5次。

而Gemini用的是CoT@32（非常不明显的灰色小字标注），意思是每个问题要回答32次，选出出现次数最多的答案作为输出。

潜台词是，Gemini的实际准确率并不高，这才需要不断重复同一问题的回答。

许多人表示，Gemini的能力超过GPT-3.5毋庸置疑，但能否超越GPT-4，还需要打一个问号。

在文章开头那段有趣的视频，也有人提出质疑。一名叫Santiago Valdarrama的机器学习讲师认为视频并不是实时录制，而是经过后期剪辑的，是一场精心挑选而制造的骗局。

谷歌也在随后也迅速发文回应，详细解释了Gemini是如何进行多模态推理的：

谷歌表示，Gemini可以根据不同的模态组合——比如案例中演示的文本和图像，预测接下来可能发生的事情并做出反应，同时Gemini能将这些模式无缝结合在一起，创造新的可能性。

在AI应用日新月异、行业不断大洗牌的当下，或许在Gemini发布不久后，刚刚平息内部乱局的OpenAI就会携崭新的GPT-5杀回来…又或许一个名不见经传的AI再次惊艳世人……让我们拭目以待吧！

近期资讯

AI硬件方向爆发！阶段主线会是它吗？——道达投资手记

每日经济新闻 2024-12-26

上海米光科技申请高光效LED灯模组照明系统专利，显著降低能耗

金融界2024年12月26日消息，国家知识产权局信息显示，上海米光科技有限公司申请一项名为“高光效LED灯模组照明系统”的专利，公开号CN119183226A，申请日期为2024年9月。

金融界 2024-12-26

三思照明LED光饼杀菌灯：包袋中的“消毒秘密”

有没有想过，一款小到能放进包袋的紫外线杀菌灯，竟然能随时为你提供99.9%的杀菌保护？专注LED技术31年的三思照明，打造的LED光饼杀菌灯，正是这样一个“消毒法宝”。它内置4颗高能量UVC-LED紫外线灯珠，仅需3分钟，杀菌率超越99.9%。小小的体积可以轻松放进口袋或包中，不管是家中，还是外出住酒店，都能随时取用，做你的贴身健康卫士。

极目新闻 2024-12-26

惠州市低空经济产业联盟揭牌！千人齐聚惠州电子信息产业峰会

记者杨振华实习生刘继铧12月25日，以“向‘新’而行以‘质’致远”为主题的2024惠州市电子信息产业峰会暨惠州市电子信息产业协会年会召开。据悉，本次峰会聚焦于“以新质生产力促进制造业变革”，采用分论坛的形式展开深度探讨，并组织了华为、智茂科技、瓦力等50家政企代表集中展览展示。

南方都市报 2024-12-26

科创引领·新质大庆|大庆市举行2024科技+产业对接大会

央广网大庆12月26日消息（记者陈显春）12月26日，科创引领·新质大庆—2024科技+产业对接大会在大庆市举行。大会聚集了国内、省内部分高校院所专家学者、科技创新企业代表，通过常态化搭建科学家与企业家对接平台，推动更多科技成果走出实验室、走上生产线、走向国内外市场，共享时代新机遇，共赢合作新未来。

央广网 2024-12-26

协鑫集成发布基于BC技术的GPC2.0高效组件

光伏要突破内卷，科技创新是唯一路径。12月26日，协鑫集成发布了基于BC技术的GPC2.0高效组件，将2382*1134mm组件的功率提高到660W，为分布式市场带来更优场景解决方案。

证券时报 2024-12-26

提升MATLAB代码阅读能力的实用建议与技巧总结

可是，对于很多初学者来说，MATLAB的学习曲线可能会有些陡峭，特别是在阅读和理解MATLAB代码时，往往会感到困惑。在学习的过程中，不妨多去看看论坛、博客和视频教程，获取其他人的见解和经验。

新报观察 2024-12-26

高校大模型产业发展与技术交流活动在成都高新区举行

12月26日，“2024人工智能大模型基准测试科创发展大会”的分论坛活动高校大模型产业发展与技术交流活动在成都高新区举行。

中国证券报 2024-12-26

纳秒级写入、超万亿次擦写！中国公司实现SOT-MRAM存储关键突破

快科技12月26日消息，据媒体报道，在国际微电子领域顶级学术会议IEDM第70届年度会议上，来自中国的浙江驰拓科技发布了一项突破性的SOT-MRAM（自旋轨道矩磁性随机存取存储器）技术进展，解决了该技术在大规模生产中面临的主要挑战。

驱动之家 2024-12-26

家居新宠，海尔BCD-465WGHTDE9S9：465升十字冰箱，国补550元

海尔BCD-465WGHTDE9S9冰箱不仅在外观设计上时尚大气，更在技术应用上展现出色的表现。其超薄嵌入式设计节省空间，流畅的线条与现代色彩搭配，使其成为家居中的一道亮丽风景线。此外，海尔冰箱在性能上同样表现出色，采用风冷无霜技术，彻底解决了传统冰箱易结霜的问题，冷风循环吹拂，降温迅速且温度均匀，有效延长食材的保鲜期。

小米地瓜 2024-12-26

超越GPT！？又一个史上最强AI大模型来了

规模最大、功能最强！？

超越GPT，超越人类！？

有失偏颇，惹来众议……

推荐体验

相关资讯

AI大模型“上车”，又一个狼来了？

大模型上车，AI的又一个“狼来了”？

超越GPT-4o 史上最强AI大模型来了！

又一个AI大模型来了！CEO李志飞现场演示菜谱推荐

室温超导，又一个ChatGPT？

近期资讯

AI硬件方向爆发！阶段主线会是它吗？——道达投资手记

上海米光科技申请高光效LED灯模组照明系统专利，显著降低能耗

三思照明LED光饼杀菌灯：包袋中的“消毒秘密”

惠州市低空经济产业联盟揭牌！千人齐聚惠州电子信息产业峰会

科创引领·新质大庆|大庆市举行2024科技+产业对接大会

协鑫集成发布基于BC技术的GPC2.0高效组件

提升MATLAB代码阅读能力的实用建议与技巧总结

高校大模型产业发展与技术交流活动在成都高新区举行

纳秒级写入、超万亿次擦写！中国公司实现SOT-MRAM存储关键突破

家居新宠，海尔BCD-465WGHTDE9S9：465升十字冰箱，国补550元

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响