当前位置:首页|资讯|GPT-4|OpenAI|搜索引擎

记忆助手「Rewind」接入Gpt-4,从此你也能过目不忘,OpenAI CEO点赞

作者:机器之能发布时间:2023-08-08

谁能想到蔡依林的《倒带》还真有了现实版。当然,逝去的感情很难倒带,数字痕迹却有可能再度获得。

重温一个想法时,我们常常想不起更多细节。好像在哪里看到或者听到过,微博、公众号?还是会议室的白板上?抑或是同事在腾讯会议上说过?

如果它藏在今天收到的上百条 Slack 消息中,再找到它无异于一场灾难。

遗忘曲线告诉我们,绝大部分新掌握的知识约在一周后被遗忘,一个月左右基本忘光。「好记性不如一个烂笔头」,一家名为 Rewind AI 的创业公司还真做出了这个「烂笔头」:Rewind(翻译过来有「倒带」的意思,目前面向 iPhone、Mac 用户)。

官方将这款 AI 应用称为「你生活的搜索引擎」,用户可以通过它随时回溯过往数字信息,就像有了「过目不忘」的超能力。

具体而言,得到你的同意后,Rewind 会记录下你在手机(电脑)上看过的所有信息,并支持回看、检索、总结概要等功能,相当于随时帮你截图保存,而且保存的结果是可检索、可交互的。

就苹果手机客户端来说,它主要包括以下功能。

首先,它会自动捕获你在 Safari 浏览器中阅读的内容,包括导入的屏幕截图,你可以随便浏览和搜索。

应用启动后,屏幕下方会出现一条可以来回滑动的时间线,滑动它即可显示你之前使用过的内容。

官方Demo中浏览某应用的情况。

机器之心也用苹果手机试用了一下,滑动条上的每个图标都代表着刚才浏览过的网页,包括浏览的时间。

在搜索功能里,输入「law」,Rewind 将我们刚才浏览过的包含这个关键信息的页面呈现出来。因为接入了 Gpt-4,连带有「law」内容的图片也会被准确搜索出来。

在 「Ask Rewind 」功能里,因为接入了 GPT-4,我们可以就自己看到的任何内容提出问题,包括创建摘要,跨应用总结信息。

我们尝试让它总结浏览过的网页中有关 GPT-4 法律应用的案例,结果找到了。

有推特网友使用 Ask 功能让 Rewind 总结一天当中他感兴趣的信息。

除了快速浏览过去的任何内容,还能进行复制粘贴操作。

针对 Mac 电脑开发的客户端功能更加强大,包括自动整理会议摘要、起草电子邮件等。

知乎网友的使用体验(部分内容截图)

总体来说,Rewind 还是很有自己特点。

首先,因为使用的是光学字符识别(OCR)来识别和索引屏幕上出现的所有单词,所以,无需与 Gmail,Dropbox 或 Slack 等云产品集成,既可实现「倒带」。

此外,OCR 使用户能够复制和粘贴过去的任何内容。

其次,为了搜索用户所说的或听到的任何内容,他们使用了最先进的自动语音识别 (ASR),尤其是针对会议发言、讨论和决策内容,甚至以可视方式共享的内容,Rewind 都可以捕获它们。

就图片信息而言,只要你说出关键词,Rewind 会先根据会议音频内容生成文字记录,再根据文字记录定位关键词并显示相应图片内容。另外,出于隐私考虑,所有录音会本地存储在用户的电脑包括手机,只有用户可以访问它们。用户数据也不会用于训练 AI 模型。虽说 OCR、ASR 可以在本地完成运作,但用户与 Gpt-4 的交互仍然需要将数据送往云端。Rewind 的解释是,「仅有基于文本的相关数据」会被传至云端,不包括其他音频、视频、图像类。

除了GPT-4 赋予的底层能力使「倒带」成为可能,Rewind 的成功还离不开苹果特色的硬件基础设施。这也是为什么他们先推出电脑版本,再过渡到苹果手机。

比如,芯片。最初,产品仅在最新的 Mac 上工作,因为它们依赖于苹果的 M1 和 M2 芯片。

「我们几乎利用了片上系统 (SoC) 的每个部分,因此运行 Rewind 在录制时不会占用系统资源(如 CPU 和内存)。感觉几乎难以察觉。」Rewind AI 联合创始人 Dan Siroker 在官方博客中写道。另外,还需要发明一种压缩技术以适应现有硬盘规格。在本地存储所有录音意味着压缩技术非常重要。Rewind 可以将原始记录数据压缩多达 3,750 倍,而不会造成重大质量损失,例如,10.5GB 的原始录制数据变为 2.8MB。

即使你的苹果产品用的是最小硬盘驱动器,也可以存储多年的录音。

Dan Siroker 在 20 多岁时开始失聪。30 岁时,助听器改变了他的生活。失去一种感觉,又重新获得它,感觉就像获得了一个超能力。从那一刻起,他一直在寻找用技术增强人类能力的办法。

就像我们的听力一样,随着年龄的增长,人类记忆力会变差。我们有助听器和眼镜对抗衰老带来的能力衰退,那么,记忆力呢?这也是他们创立 Rewind 的原因——给人类完美的记忆能力。

事实上,他们在 2020 年就开始追求这一愿景,并为此构建了第一款产品 Scribe,一个记录你所有会议并使其可搜索和共享的 AI 机器人。在拥有 30,000 名用户之后,经验和反馈让他们转向 Rewind 的开发。

Rewind 刚推出就获得 a16z 领投的 1000 万美元种子轮融资。除了产品本身,部分原因也在于 Dan 也是一名连续创业者,他的第一家公司 Optimizely 的投资人也包括 a16z。

目前,Rewind 已经能支持 Chrome、Safari、Arc、Brave 等多种浏览器,以及不少线上会议应用(Google Meet, Microsoft Teams, Slack huddles, Webex, Discord 等),也支持播客、Youtube 视频或用户自己的笔记。

可以说,「倒带」这类应用的能力变强,依赖于可支持的生态丰富程度,更离不开用户授权。当你授权的应用越多,又自然引发担心:Rewind 对个人隐私的威胁。

当我们打开应用时,迎面而来的就是一系列需要授权的请求,包括在我看来非常隐私(以至于几乎不授权给任何手机应用)的应用程序(例如相册),有多少人会将这些非常隐私的足迹共享给一个 AI 应用呢?特别是当人看过斯诺登的 Permanet Record 以后。

Rewind 是付费的,价格并不便宜。所谓免费,也仅限于 50 次试用。其中浏览、搜索和 Ask(Gpt-4),每个功能启用一次就算消耗了一次。12 美元的月付费只有 10 次的「倒带」机会。虽然 36 美元套餐不限次数,但考虑到它目前还很难说是刚需,36 这个数字仍然感觉偏贵。

本文来自微信公众号“机器之能”(ID:almosthuman2017),作者:Sia,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1