谷歌用双子座Gemini“愚弄”了所有人，并没有真正击败 GPT-4

作者：数字化前哨战发布时间：2023-12-10

谷歌似乎很绝望。在宣布在今年秋天推出双子座后，谷歌未能兑现其承诺。现在，双子座在年底突然推出，这表明谷歌不想被抛在后面。它似乎是在压力下采取行动的，当时OpenAI和Microsoft等其他参与者正在推出新产品。

在谷歌发布的三款 Gemini 模型中，Gemini Ultra 在各种基准测试中的表现都优于 OpenAI 的 GPT-4，包括 MMLU——这是一个用于评估语言模型在从 STEM 到社会科学和人文科学等一系列学科中的能力的关键指标。

如果深入研究 Gemini 的技术报告，我们会发现在 MMLU 基准测试中，Gemini Ultra 的表现优于 GPT-4 和 GPT-3.5。然而，故事的转折点在于，谷歌巧妙地采用了 COT@32 而不是 5 次学习来增强 Gemini 的感知性能。

深入研究 MMLU Gemini Beat——Gemini 并没有真正击败 GPT-4。当我们在 MMLU 基准上评估任何大型语言模型（LLM）时，我们通常采用 5 次学习，“Abacus AI 的创始人 Bindu Reddy 指出。

谷歌通过演示视频展示了 Gemini Ultra 的多模态功能。然而，后来发现该视频是上演的。

谷歌上传的六分钟视频引导我们通过各种例子，在这些例子中，双子座进行流畅的对话，回答查询和参与活动，例如与人玩石头剪刀布等游戏。

在演示中，似乎一切都在实时发生，Gemini 能够快速做出反应。相反，该视频的 Youtube 描述是：“出于此演示的目的，延迟已减少，为简洁起见，Gemini 输出已缩短。

实际上，演示不是实时进行的，也不是通过语音交互进行的。当彭博社就该视频与谷歌联系时，一位发言人解释说，它是“使用镜头中的静止图像帧，并通过文本提示”创建的。简单地说，他们首先给Gemini提供图片，然后他们编写文本提示来获得输出。

然而，Gemini Ultra 还没有出来。谁知道呢，到明年问世时，它实际上可能比 GPT-4 更好。谷歌只能希望 OpenAI 届时不会发布 GPT-5。

相关资讯

谷歌Gemini（双子座）

就在昨晚，谷歌发布了最近备受关注的双子座模型，简单的来聊聊，仅仅个人观点。与直接提供，让用户使用的方式不同。这次谷歌的野心很大，推出的是与ChatGPT模式相同的方式，即“调用”，并且给出了调用方法。目前不清楚，国内能不能直接调用API ，相信等之后一众大佬的研究下，会有更利于我们使用方式的出现，进入正文。一、双子座简介双子座是谷歌发布的最新的AI，训练模型。在相关的测试中，也打出了超越GPT4的旗号，并且支持动态的，连续的场景互动。单单仅对我个人而言，其实并不能很好的理解它的所有功能使用，当然，现

谷歌 ChatGPT GPT-4

北风诉苦 2023-12-14

分析表明Gemini大模型并没有超越GPT-4，谷歌创新能力遭遇质疑

在谷歌、DeepMind的双重光环加持下，整个世界都将目光投向了Gemini，这一号称史上最强的AI大模型。但是从后续的结果来看，很明显，谷歌让人失望了，这种失望提醒着我们：“即使是大厂推出的AI工具，也应理性看待，不宜过度炒作！”Alphabet首席执行官Sundar Pichai说：“Gemini模型天生就比其它模型更强大，它是一个平台。AI实际上就是平台的大转变，意义比WEB或者移动端更大。对我们来说，Gemini向前跨了一大步。”对谷歌来说，Gemini当然是一大进步，但对AI行业来说进步可没那么

GPT-4 谷歌 AI大模型

电科技 2023-12-10

谷歌发布“双子座”AI模型称其性能优于GPT-4和人类“专家”

参考消息网12月8日报道据英国《新科学家》周刊网站12月6日报道，谷歌推出了名为“双子座”(Gemini)的新人工智能(AI)模型，声称在一系列智能测试中，其表现可以超越美国开放人工智能研究中心(OpenAI)的GPT-4模型和人类“专家”。根据用途不同，谷歌创建了三个版本的“双子座”模型，分别称为Nano、Pro和Ultra。

谷歌 OpenAI GPT-4 人工智能

参考消息 2023-12-08

谷歌公司发布人工智能模型“双子座”

新华社旧金山12月6日电（记者吴晓凌）美国谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座（Gemini）”。谷歌公司称，“双子座”将推出Ultra、Pro和Nano三个版本。据谷歌公司介绍，其生成式人工智能聊天机器人“巴德”从6日起将使用“双子座”Pro的微调版本。

谷歌人工智能

中国青年网 2023-12-07

无门槛双子座内容生成，免费的gemini的api调用

在当今这个信息爆炸的时代，人工智能的应用日益广泛，从自动化工厂流水线到个人助手，再到文艺创作，AI 的影响力无处不在。特别是在文艺创作领域，人工智能带来了一种全新的创作方式。本文通过介绍和解释一个简单的基于 AI 的诗歌生成程序，探讨了人工智能在文艺创作中的应用及其潜力。代码import google.generativeai as genaiimport os# 将 API 密钥替换为您自己的密钥api_key = "AIzaSyDdn5dfV85s5464hh"# 配置API密钥genai.confi

人工智能编程谷歌

余汉波 2024-02-21

近期资讯

胡同学168 2024-12-27

我国首艘弹射型两栖攻击舰：中国海军 076 两栖攻击舰首舰在上海下水，命名为四川舰

据新华社消息，12 月 27 日，中国海军 076 两栖攻击舰首舰在上海下水，命名为四川舰，舷号为“51”。中国人民解放军新闻传播中心官方微博“中国军号”发布消息称，这是“我国首艘弹射型两栖攻击舰”。今天上午，由我国自主研制建造的 076 两栖攻击舰首舰下水命名仪式在上海沪东中华造船厂举行。“起来，不愿做奴隶的人们……”10 时许，下水命名仪式开始，伴随着雄壮的中华人民共和国国歌，五星红旗冉冉升起。参加仪式的海军有关领导宣读中央军委授予舰名、舷号的命令，向接舰部队颁发命名证书，并为 076 两栖攻击舰首舰

谁学习不疯_ 2024-12-27

低压缺氧会引发氧化应激和炎症反应，并破坏肠道微生物组和代谢。针对此问题，高原适应性研究团队（西藏农科院畜牧所李斌副研究员、兰州大学公卫学院黄小丹副教授等跨区域、跨部门、跨学科联合组建）开发了一种结合开菲尔和芫根（Brassica rapa L.）粗多糖的合生元发酵乳清饮料，以探索其对小鼠高原损伤的保护作用。相关研究“Brassica rapa L. crude polysaccharide meditated synbiotic fermented whey beverage ameliorates hy

迈维医学 2024-12-27

谷歌用双子座Gemini“愚弄”了所有人，并没有真正击败 GPT-4

推荐体验

相关资讯

谷歌Gemini（双子座）

分析表明Gemini大模型并没有超越GPT-4，谷歌创新能力遭遇质疑

谷歌发布“双子座”AI模型称其性能优于GPT-4和人类“专家”

谷歌公司发布人工智能模型“双子座”

无门槛双子座内容生成，免费的gemini的api调用

近期资讯

生物| No. 12 细胞代谢（上）

革新传统：陈腐垃圾分类处理设备的崛起——填埋垃圾处理生产线的新篇章

1panel搭建wordpress网站如何快速搭建网站如何快速建站博客搭建

我国首艘弹射型两栖攻击舰：中国海军 076 两栖攻击舰首舰在上海下水，命名为四川舰

哮天犬直播保镖-自定义设置拉黑条件-自动踢人-防止同行恶意举报-为直播间保驾护航

p 02

西藏农科院&兰州大学公卫学院开发合生元饮品，减缓高原肠道损伤

《大学物理》郝玉英第六版第十一章（真空中的稳恒磁场）自测题解析

航拍中国第三季笔记（河北）

拍人太有氛围感了！vivo S20超强人像实力揭秘

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响