过去几年,不少人都认为在个人电脑和智能手机之后,AR 设备将成为下一代个人计算平台。而在 ChatGPT 之后,有一部分人先改变了自己的观点,认为在生成式 AI 技术之上,将长出真正的下一代个人计算平台。
今时今日,个人 AI 专用设备到底有没有戏,仍然是一个充满悬念的问题。但至少在今年的 CES 上,rabbit r1 再一次证明了一点:确实有人愿意为个人 AI 专用设备买单。
1 月 11 日,初创公司 Rabbit 官方在 X(Twitter)上宣布首日就卖出了 1 万台 rabbit r1,比起他们内部设想的 500 台高了整整 20 倍,同时还表示第二批 rabbit r1 订单预计将于 4 月到 5 月交付。
图/ X@Rabbit
考虑到 199 美元的售价,等于说 rabbit r1 还没正式交付就在第一天就产生了 200 万美元(约合人民币 1419 万元)的销售收入。
不只是 Rabbit 官方,很多人也没有想到 rabbit r1 会取得如此漂亮的开头,甚至有人又喊出了「AI 时代的 iPhone 时刻」(This is the iPhone moment for the AI Era)。当然也有人严重怀疑 rabbit r1 的意义,还认为一旦手机厂商将大模型集成到语音助手上,直接就会杀死 rabbit r1 这类产品。
所以 rabbit r1 到底是什么样一款产品?
rabbit r1,长在生成式 AI 上的个人终端?
rabbit r1 是一个完全独立的硬件设备,尺寸不到一个巴掌大,正面搭载了一块 2.88 英寸的触摸显示屏,除此之外全采用了橙色涂装。
屏幕右侧有一个模拟滚轮,再上方还有一个可以 360° 旋转的摄像头,不使用的时候朝上或朝下,使用的时候可以朝前作为前置摄像头,或是朝后作为后置摄像头。机身左侧,rabbit r1 配备了唯一一个 Type-C 接口,机身右侧则有一个最最重要的实体按键——按住就能开启「对话」。
图/ Rabbit
此外,rabbit r1 支持 WiFi 和蜂窝网络连接,还配备了 2.3GHz 联发科 Helio P35 芯片、4GB 内存以及 128GB 存储空间,官方宣称满电续航为「一整天」。
rabbit r1 在硬件部分就到此为止,但不管从宣发还是 Rabbit 官网上的介绍都可以看出,rabbit r1 上搭载的 rabbit OS 才是真正的核心。
rabbit r1 的交互,或者说使用方式非常简单,按住「对话」按钮并发出语音指令,rabbit OS 就能利用生成式 AI 技术理解并拆解,再由此进行相应的操作和反馈。
图/ Rabbit
举个例子,雷科技参加本届 CES 大会的编辑「一位天明」因为要赶不同区域不同展馆(很多时候距离很远)的活动,需要频繁叫 Uber,如果在手机上交互每一次基本都需要重复「解锁」「打开 Uber App」「输入目的地」「确认订单」等步骤。
但在 rabbit r1,用户可以直接按住「对话」按钮并说,「帮我叫一辆 Uber 去 xxx(地点)。」机器会自动化解析指令并执行一系列操作,在云端完成叫 Uber 的所有操作流程,最后输出呈现车牌号、车型等必要的信息。再比如,rabbit r1 也能连接 Spotify 账户播放音乐、预订机票等等(账户需要在 Raddit Hole 自行连接)。
此外,利用 360° 旋转的摄像头,rabbit r1 也能进行基本的视频通话,还包括执行一些最新的计算机视觉应用,但官方暂未提供更明确的信息,或许相关功能或软件支持还没有到位。
总的来说,rabbit r1 本身并不搭载各种 App,而是利用最新的生成式 AI 理解用户的「自然语言」,再通过云端拆解以及自动化操作完成指令。按照 Rabbit 官方的说法,rabbit r1 目前仅支持部分主流应用,但也有「学习」能力:
> rabbit OS 是第一个建立在 Large Action Model(LAM)上的操作系统,该模型将学习用户使用特定应用的意图和行为,然后模仿和执行。
与我们更常听到的大型语言模型 Large language model(LLM)不同,Rabbit 所谓的 LAM 大型动作模型,虽然同样要先理解用户说出的话,但 LAM 更侧重于理解人类如何使用应用和服务并进行模仿操作,而不是依赖于 API 接口。
图/ Rabbit
官方表示,LAM 基于互联网上大量消费者发布的应用程序界面进行训练,而且随着训练数据的增多和质量的提升,LAM 的能力还能更强。在训练模式下,rabbit OS 还支持用户个性化训练自己专属的 LAM 模型。
个人 AI 终端,交互为王
剥离掉「LAM 模型」的概念,其实不难理解 Rabbit 正在做的事,无非就是利用最新的 AI 技术,将语音作为人机交互的主要方式。这也是个人 AI 设备最关键的一点。
按照官网信息,Rabbit 是一家总部位于加州洛杉矶的初创公司,创始人兼 CEO 吕骋(Jesse Lyu)之前是智能音箱公司渡鸦的创始人,在渡鸦被百度收购不久后就退出了。
吕骋和渡鸦音箱,图/百度
从这个角度来看,Rabbit 的出现并不意外,不管是渡鸦智能音箱,还是 rabbit r1,说到底出发点都是将语音交互视为未来人机交互的主要方式之一。
但不仅是 rabbit r1,去年火出圈的另一款支持 GPT 模型的个人 AI 设备—— AI Pin,也是由一家初创公司 Humane 开发并推出。同样也是很简单的一款产品,AI Pin 甚至没有屏幕,虽然还有在手掌投影的功能,但几乎可以说是依靠语音和摄像头进行所有的交互和反馈。
AI Pin,图/ Humane
在多次报道大模型的文章中,我们都有提到一个观点:当大模型带来了 AI 理解能力的飞跃,很可能将彻底改变人机交互的主要方式。事实也证明了,手机厂商、初创硬件公司以及大模型厂商都在围绕「对话」的交互变革来开发和升级新的产品。
Humane 的两位创始人均来自苹果公司,曾共同参与 Mac、iPod、iPad、iPhone、Apple Watch 和 iOS 的研发。一位专注于用户界面和交互,协助发明了第一代 iPhone 中首次亮相的滑动解锁功能。另一位是软件工程总监,帮助推出了初代 iPad。
有趣的是,Humane 的总部就在加州的另一大城市——旧金山,这里还有一家如今无人不知、无人不晓的公司—— OpenAI。
早在去年 9 月,The Information 就曝出 OpenAI CEO Sam Altman 与前苹果传奇设计师 Jony Ive、软银创始人孙正义已经在商讨开发一种全新的 AI 设备,后来还有消息指出即将离任的苹果产品设计副总裁 Tang Tan 也将参与该项目。
小雷不知道这个项目到底会做出什么样的产品,但几乎可以笃定,它一定也在围绕新的人机交互方式进行构建。
CES(美国拉斯维加斯国际消费类电子产品展览会) 2024火热进行时,雷科技编辑“一位天明”正在美国·拉斯维加斯现场直击报道,欢迎在雷科技微信(ID:leitech)、微博、微头条获取CES2024一手观察。