当前位置:首页|资讯|AI大模型

超越GPT!?又一个史上最强AI大模型来了

作者:GenJi是真想教会你发布时间:2023-12-08

hi~大家好我是genji!今天刚睡醒就被一条突发新闻刷屏了——又一个“史上最强”AI大模型诞生了!(⁎⁍̴̛ᴗ⁍̴̛⁎)所以我就麻溜儿写个专栏和大家说道说道~


先让我们来看一段视频,一个男子做出后仰并躲避的慢动作,AI马上知道:这是表演《黑客帝国》中的“子弹时间”:


当一只手在镜头前不断变化手势,AI也能马上识别手势是在模仿什么东西:


当你寥寥数笔勾勒出一只鸭子,AI会根据水波纹来判断这是鸭子而不是鸟:


当你给鸭子涂上蓝色,AI会吐槽:蓝色鸭子这种玩意可不多见!


让这只小鸭子出现在世界地图上呢?AI甚至会调侃:看来这只鸭子没有地方栖息和找吃的~


这些片段,是谷歌演示最新出炉的AI大模型Gemini的场景。


规模最大、功能最强!?

美国时间12月6日早间,谷歌宣布推出最新AI大模型Gemini,并宣称它比市面上所有人工智能系统都更强大,在测试中连ChatGPT都要甘拜下风。


Gemini针对不同场景有三个版本:Ultra、Pro 和Nano,简单概括:

  • Ultra - 用于处理高度复杂任务的模型,功能最强、规模最大。

  • Pro - 用于扩展各种任务的最佳模型。

  • Nano - 用于手机等设备的最高效模型。

在AI大模型风靡国内外的当下,相信你对于“多模态”这个词已经见怪不怪了。什么意思呢?如果你在跟AI聊天的时候,你们可以无障碍地进行文字、图片、语音等多种交流,那这就是多模态。


和市面上现有大模型相比,Gemini从一开始就被创建为多模态的模型,这意味着它可以归纳并流畅地理解、操作以及组合不同类型的信息,包括文本、代码、音频、图像和视频。


除了开头展示的那些,Gemini还可以理解当下最火的emoji合成。

Gemini知道这个emoji是鳄梨+幽灵:


它还给这个合成的emoji起了一个新名字——派对幽灵:


不得不说,这种看起来好像没有多么厉害的小测试,但真的能在一些小可爱小细节的地方戳到你~



超越GPT,超越人类!?

在AI迅速发展的这两年,我们已经看到层出不穷的AI大模型,号称自己刷新了一个又一个“史上最强”。


就在不久前,我在专栏里给大家分享了OpenAI的划时代升级GPT-4 Turbo,没想到这个“史上最强”这么快就又又又被刷新了?


要知道,ChatGPT在大约一年前的横空出世,震动了整个科技行业,也打了谷歌在内一众老牌科技巨头一个措手不及。


谷歌一直在努力开发能与之相抗衡的AI软件,终于在今年3月迅速推出自己的聊天机器人Bard,积极参与AI大模型军备竞赛。而仅仅过了一个月,谷歌便再次宣布:“我们还有更强的杀手锏!”


于是,Gemini应运而生。


谷歌首席执行官皮查伊在今年一次开发者大会上谈及Gemini项目

那么,这个号称谷歌杀手锏的Gemini强在哪里?


回答这个问题之前,我们要了解一下MMLU测试。这是目前市面上测试AI模型知识和解决问题能力的最常用方法之一,覆盖了基础数学、美国历史、计算机科学、法律等57项知识任务,难度覆盖高中水平到专家水平的人类知识。


谷歌对Gemini作出一系列MMLU测试,并宣称Gemini 在大部分测试中都击败了GPT-4,其中性能最强的Ultra最高得分为90%,超过GPT-4的86.4%。


谷歌还在Gemini官网重点强调——这是史上第一个在测试中超越人类专家的大模型



有失偏颇,惹来众议……

然而,事情很快有了反转。

Gemini刚刚发布就惹来一众人工智能领域技术专家的质疑:


首先,在与GPT-4 对比测试的时候,GPT-4 用的是few-shot,无提示词技巧、只尝试5次。


而Gemini用的是CoT@32(非常不明显的灰色小字标注),意思是每个问题要回答32次,选出出现次数最多的答案作为输出。


潜台词是,Gemini的实际准确率并不高,这才需要不断重复同一问题的回答。


许多人表示,Gemini的能力超过GPT-3.5毋庸置疑,但能否超越GPT-4,还需要打一个问号。


在文章开头那段有趣的视频,也有人提出质疑。一名叫Santiago Valdarrama的机器学习讲师认为视频并不是实时录制,而是经过后期剪辑的,是一场精心挑选而制造的骗局。


谷歌也在随后也迅速发文回应,详细解释了Gemini是如何进行多模态推理的:


谷歌表示,Gemini可以根据不同的模态组合——比如案例中演示的文本和图像,预测接下来可能发生的事情并做出反应,同时Gemini能将这些模式无缝结合在一起,创造新的可能性。


在AI应用日新月异、行业不断大洗牌的当下,或许在Gemini发布不久后,刚刚平息内部乱局的OpenAI就会携崭新的GPT-5杀回来…又或许一个名不见经传的AI再次惊艳世人……让我们拭目以待吧!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1