昨日,谷歌发布了其新一代人工智能大模型——Gemini 2.0,号称“为智能体时代设计”。
据谷歌介绍,Gemini 2.0带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。
在关键基准测试中,Gemini 2.0相较于前代Gemini 1.5 Pro性能大幅提升,速度至高提升两倍。这一速度提升意味着,用户将得到更高效的处理能力和更快的响应时间。
具体来看,Gemini 2.0采用了最新的机器学习和深度学习算法,提升了神经网络的结构和效率,核心特点在于其强大的多模态能力:支持原生图像和多语言音频输出,以及原生工具使用。
这意味着,该模型支持图像、视频和音频等多模态输入与输出,例如与文本混合的原生文生图和可自定义的文本转语音(TTS)多语言音频内容。
此外还支持原生调用工具,如Google搜索、代码执行以及第三方用户定义函数等,进一步扩展了其应用范围。
由此看来,Gemini 2.0能够更好的理解和生成自然语言,增强了人机交互的智能性。
基于Gemini 2.0架构之上,谷歌推出了三个新的AI智能体原型:通用大模型助手Project Astra、浏览器助手Project Mariner、编程助手Jules。
据悉,谷歌Pixel 9a手机将搭载Gemini 2.0,这也可能是最后一款使用三星代工处理器的Pixel设备。
谷歌Pixel 9a的机身尺寸为154.7x73.3x8.9mm,重量为185.9g,略大于 Pixel 8a,但重量更轻。将提供四款配色可选,除了传统的白色和黑色之外,新增了粉色(Peony)和紫色(Iris)两种颜色,放弃绿色(Aloe)和蓝色(Bay)。其中粉色和基础款 Pixel 9 颜色相似,而紫色号称源自于鸢尾花。
新机将配备一块6.285英寸Actua显示屏,峰值亮度达2700尼特,HDR亮度为1800尼特,并覆盖了Gorilla Glass 3保护玻璃;搭载Google Tensor G4处理器和Titan M2安全芯片,配备8GB LPDDR5X RAM和128GB/256GB UFS 3.1存储空间。
影像方面,谷歌Pixel 9a前置1300万像素IMX712传感器,后置4800万像素GN8 Quad Dual Pixel主摄像头 (f/1.7) 和1300万像素IMX712超广角摄像头 (f/2.2)。
看完了手机和最新AI大模型,我们再来看看其他领域的谷歌产品。
今日,谷歌宣布推出全新操作系统 Android XR,“XR”代表“扩展现实”,包括虚拟现实、增强现实和混合现实等多种技术。
谷歌官方表示,通过头戴显示器,用户可以随时在虚拟世界和现实世界之间自如切换,享受全新的沉浸式体验。
Android XR 的发布视频中并未透露太多细节,仅展示了头戴设备的渲染图和“概念化设计”示例。
首款亮相的设备是由三星打造的混合现实头戴设备 Project Moohan,将支持 Gemini、Google Maps、Google 相册、翻译、Chrome、圈选即搜等应用,同时也为现有 Android 应用提供支持。