当前位置:首页|资讯|谷歌|AI大模型|大语言模型

陈根:落败一年后,谷歌终于发布了AI大模型

作者:陈根谈科技发布时间:2023-12-08

原标题:陈根:落败一年后,谷歌终于发布了AI大模型

文/陈根

在ChatGPT发布一年后,谷歌终于憋出了大招。当地时间12月6日,谷歌宣布正式推出大语言模型Gemini。

谷歌表示,Gemini是迄今“规模最大、功能最强”的AI模型,它分为三个版本,可以满足不同场景的需求。

第一个版本是轻便的版本Gemini Nano,可以在安卓设备上离线运行;第二个版本Gemini Pro 是一个更强大的版本 ,它将很快为谷歌的产品提供动力,并且从12月6日开始接入 Bard;第三个版本也是功能最强大、规模最庞大的Gemini Ultra,主要是为数据中心和企业应用设计,谷歌计划于明年推出。

当然,大家最关心的肯定还是Gemini的水平。用谷歌的话来说,就是吊打GPT。根据谷歌展示,针对于性能,在 32 项基准测试中,Gemini 有30项领先于 GPT-4,其中包括多任务语言理解基准测试等广泛的整体测试,也有生成 Python代码能力的测试。

此外,功能最强大的Gemini Ultra 得分率甚至高达 90.0%,是首个在大规模多任务语言理解 MMLU中超越人类专家的模型,MMLU 综合运用了数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试世界知识和解决问题的能力。

除此之外,更值得我们关注的,是Gemini多模态能力。我们只要观察今天市面上的大模型,就会发现,即便是GPT-4,虽然有在往多模态发展,但仍主要聚焦在文本处理上。比如ChatGPT,最厉害的地方依然是文字处理能力,能回答各种问题、甚至能写诗。但除此之外,9月份更新的图像识别、语音输入等功能,虽然也可以,但并没有文字那么给力。Gemini就不一样,写诗、画画、编歌、剪视频,无缝理解,是个全才。

打个比方,如果说ChatGPT是一台高效的单屏电脑,Gemini大概就是一套全功能的多屏工作站。单屏电脑提供基本的计算和办公功能,而多屏工作站则可以同时处理多个任务,展示更多信息。

除了发布大模型,谷歌还同时发布了专门训练AI的最强芯片Cloud TPU v5p,可以说,谷歌这次发布是做足了准备。

不过,谷歌的Gemini 只有英语版本,其他语言版本将在未来陆续推出。但谷歌首席执行官 Sundar Pichai 表示,该模型最终将集成到谷歌的搜索引擎、广告产品、谷歌浏览器等等。

当然,谷歌Gemini能力到底怎么样,或许还要等一段时间,市场真正试用过了之后,才会有真实的反馈声音。但谷歌的这一次发布,也给了我们很重要的一个启示,那就是:好饭不怕晚,这也是今天我们国内的企业很缺少的一点。

去年ChatGPT刚推出来的时候,我们的很多企业就开始布局大模型,各种训练模型,急着推出来,但推出来以后,不是闹出了各种笑话,就是连公测都不敢公测,只能停留在发布会层面。很多企业都打着对标ChatGPT的口号,但最后是什么样子,大家有目共睹。

再来看谷歌,虽然在年初被认为是惨败,但谷歌依然还是投入了足够的资源和时间,并且还分出了不同版本,提供给B端用户和C端用户,才发布了今天的模型,谷歌的做法,值得我们的企业学习。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1