谷歌AI大模型Gemini亮相：擅长复杂学科推理，懂编程语言 PK GPT-4

作者：雷递发布时间：2023-12-07

雷递网乐天 12月7日

美国科技巨头谷歌今日宣布推出人工智能模型Gemini，并针对三种不同的尺寸优化了 Gemini 1.0：

Gemini Ultra——谷歌最大、最有能力的模型，适用于高度复杂的任务。

Gemini Pro——谷歌可扩展各种任务的最佳模型。

Gemini Nano——谷歌最高效的设备端任务模型。

据谷歌称，公司一直在严格测试Gemini模型并评估其在各种任务中的性能。从自然图像、音频和视频理解到数学推理，Gemini Ultra 的性能在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准中的 30 个上超过了当前最先进的结果。

Gemini Ultra的得分高达90%，是第一个在 MMLU（大规模多任务语言理解）上超越人类专家的模型，该模型结合了数学、物理、历史、法律、医学和伦理学等 57 个科目来测试知识和解决问题的能力。

Gemini新的 MMLU 基准方法使 Gemini 能够利用其推理能力在回答难题之前更仔细地思考，从而比仅使用第一印象有显着改进。

该图表显示了 Gemini Ultra 在常见文本基准测试中的性能与 GPT-4 的比较（在报告数字缺失的情况下计算的 API 数字）。Gemini 在文本和编码等一系列基准测试中超越了最先进的性能。

Gemini Ultra还在新的MMMU 基准测试中取得 59.4% 的最先进分数，该基准测试由跨越不同领域、需要深思熟虑的推理的多模态任务组成。

根据谷歌测试的图像基准，Gemini Ultra 的性能优于以前最先进的模型，无需从图像中提取文本以进行进一步处理的对象字符识别 (OCR) 系统的帮助。这些基准凸显了双子座天生的多模态性，并表明了双子座更复杂推理能力的早期迹象。

擅长复杂学科推理能懂编程语言

Gemini 1.0 复杂的多模式推理功能可以帮助理解复杂的书面和视觉信息。这使得它在发现大量数据中难以辨别的知识方面具有独特的能力。

Gemini 1.0 通过阅读、过滤和理解信息从数十万份文档中提取见解的卓越能力将有助于在从科学到金融的许多领域以数字速度实现新的突破。

Gemini 1.0 经过训练，可以同时识别和理解文本、图像、音频等，因此它可以更好地理解微妙的信息，并可以回答与复杂主题相关的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

谷歌的第一个版本的 Gemini 可以理解、解释和生成世界上最流行的编程语言（如Python、Java、C++ 和 Go）的高质量代码。它跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。

Gemini Ultra 在多个编码基准测试中表现出色，包括 HumanEval（用于评估编码任务性能的重要行业标准）和 Natural2Code（我们内部保留的数据集），该数据集使用作者生成的源而不是基于网络的信息。

Gemini还可以用作更高级编码系统的引擎。两年前，谷歌推出 AlphaCode，这是第一个在编程竞赛中达到竞争性能水平的人工智能代码生成系统。

使用Gemini 的专门版本，谷歌创建更先进的代码生成系统 AlphaCode 2，它擅长解决超出编码范围、涉及复杂数学和理论计算机科学的竞争性编程问题。

Pixel 8 Pro将运行Gemini Nano

谷歌还将Gemini引入Pixel。Pixel 8 Pro是第一款运行Gemini Nano的智能手机，它支持 Recorder 应用中的 Summarize等新功能，并从WhatsApp开始推出Gboard中的Smart Reply，明年还会推出更多应用。

在接下来的几个月中，Gemini将出现在谷歌更多的产品和服务中，例如搜索、广告、Chrome 和 Duet AI。

谷歌已经开始在搜索中试验 Gemini，它使用户的搜索生成体验 (SGE) 更快，美国英语的延迟减少了 40%，同时质量也得到了提高。

谷歌和 Alphabet 首席执行官桑达尔·皮查伊 (Sundar Pichai)说，每一次技术变革都是推进科学发现、加速人类进步和改善生活的机会。

“我相信我们现在所看到的人工智能转变将是我们一生中最深刻的转变，远远大于之前向移动或网络的转变。人工智能有潜力为世界各地的人们创造从日常生活到非凡的机会。它将带来新一波的创新和经济进步，并以前所未有的规模推动知识、学习、创造力和生产力。”

皮查伊说，“我们正与Gemini一起迈出下一步，这是我们迄今为止功能最强大、最通用的模型，在许多领先基准测试中都具有最先进性能。我们的第一个版本 Gemini 1.0 针对不同尺寸进行了优化：Ultra、Pro 和 Nano。”

Google DeepMind 首席执行官兼联合创始人Demis Hassabis代表Gemini 团队发言，称长期以来，我们一直希望构建新一代人工智能模型，其灵感来自于人们理解世界和与世界互动的方式。人工智能感觉不太像一个智能软件，而更像是有用且直观的东西——一个专家帮助者或助手。

“今天，当我们推出 Gemini 时，我们离这一愿景又近了一步，这是我们迄今为止构建的最强大、最通用的模型。”

Demis Hassabis称，Gemini是整个Google团队（包括Google Research的同事）大规模协作努力的成果。它是从头开始构建的多模式，这意味着它可以概括和无缝地理解、操作和组合不同类型的信息，包括文本、代码、音频、图像和视频。

“Gemini 也是我们迄今为止最灵活的模型 - 能够在从数据中心到移动设备的所有设备上高效运行。其最先进的功能将显著增强开发人员和企业客户利用人工智能进行构建和扩展的方式。”

———————————————

雷递由媒体人雷建平创办，若转载请写明来源。

相关资讯

谷歌AI大模型Gemini亮相：擅长复杂学科推理，能懂编程语言PK GPT-4

美国科技巨头谷歌今日宣布推出人工智能模型Gemini，并针对三种不同的尺寸优化了 Gemini 1.0：Gemini Ultra——谷歌最大、最有能力的模型，适用于高度复杂的任务。Gemini P

谷歌 AI大模型人工智能编程 GPT-4

金融界 2023-12-08

谷歌推Gemini大语言模型：想超越GPT-4

2023-06-28 14:43:07 作者：赵悟省最近消息，OpenAI在今年的人工智能技术上颇受关注，使得谷歌面临很大压力。OpenAI的大模型ChatGPT广泛使用了谷歌之前提出的许多人工智

谷歌 OpenAI 大语言模型 GPT-4 ChatGPT

中关村在线 2023-06-28

国内大模型与GPT-4较高下：语言知识能力接近，复杂推理仍是短板

国内大模型与GPT-4较高下：语言知识能力接近，复杂推理仍是短板 1月30日，上海人工智能实验室发布了大模型开源开放评测体系司南（OpenCompass2.0），同时在对部分主流大模型评测诊断的

GPT-4 人工智能

第一财经 2024-01-30

谷歌炸场：全新大语言模型 Gemini 1.0 正式亮相，近乎全面领先于 OpenAI GPT-4

谷歌表示，这是其迄今为止功能最强大、最通用的大语言模型。根据谷歌给出的基准测试结果，Gemini在许多测试中都表现出了“最先进的性能”，甚至在大部分基准测试中完全击败了OpenAI的GPT-4。GeminiUltra目前只提供给被邀请的客户、开发者、合作伙伴以及安全专家进行早期实验和反馈，并计划于明年初向开发者和企业客户推出。

谷歌 OpenAI 大语言模型 GPT-4

IT之家 2023-12-07

Gemini对决GPT-4 谷歌大模型登场

如果说2022年底的人工智能的热潮是OpenAI的ChatGPT带来的，那么2023年底，谷歌带着它的Gemini高调杀回人工智能圈。过去近十年，谷歌一直把AI-first作为公司战略，2016年打败人类围棋冠军的AlphaGo便是出自谷歌之手。曾经，是谷歌掀起的一股AI浪潮改变了整个AI行业的发展，但现在，它亟需在大模型领域证明自己。

GPT-4 ChatGPT 谷歌 OpenAI 人工智能

北京商报 2023-12-07

谷歌AI大模型Gemini亮相：擅长复杂学科推理，懂编程语言 PK GPT-4

推荐体验

相关资讯

谷歌AI大模型Gemini亮相：擅长复杂学科推理，能懂编程语言PK GPT-4

谷歌推Gemini大语言模型：想超越GPT-4

国内大模型与GPT-4较高下：语言知识能力接近，复杂推理仍是短板

谷歌炸场：全新大语言模型 Gemini 1.0 正式亮相，近乎全面领先于 OpenAI GPT-4

Gemini对决GPT-4 谷歌大模型登场

近期资讯

曝V社规模小但盈利能力惊人：员工平均年收入远超Facebook和苹果

机构：预计2024年中国折叠屏手机出货量将达到910万部，同比增长2%

抖音2024年度趋势盘点：政策调整与业务升级助力商家成长

消息称三星Galaxy Ring 2智能戒指将亮相Galaxy Unpacked 2025

如何设计OTWB中的TMS系统—全流程核心功能解析

周鸿祎做IP给企业家提供了新思路

OPPO明年上半年将推三种尺寸旗舰机，Find X8 Ultra有望最早登场

畅想未来和AI工作的方式

英国拟试用全球首个AI工具评估糖尿病风险：提前10年识别潜在患者

瑞萨量产机器人用半导体 RZ / T2H，可同时控制 9 轴电机

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响