说到线上发布会,你的脑海可能浮现这样的场景:一块大屏幕,一个主舞台,穿着正式的高管们双手置于胸前,将产品卖点娓娓道来。不出错,也不出彩。
上周的 OpenAI 和 Google 发布会,有些不一样。
OpenAI 的现场布置得很有生活气息,主打北欧风的松弛感,CTO 和员工们围坐在木桌前实时演示,拉近和观众的心理距离。
Google 则用上了标志性的四色装饰舞台,还邀请了穿彩色长袍的 DJ 开场表演,演示 AI 音乐工具 MusicFX,但 DJ 几近癫狂的精神状态,反而让台下昏昏欲睡。
我尽量不过多地考虑竞争对手,但我无法停止思考 OpenAI 和 Google 之间的审美差异。
Sam Altman 看准时机,讽刺了 Google 一句,有些像当年乔布斯评价竞争对手:微软唯一的问题是他们没有品味。
说他茶味也好,戏多也罢,回顾 OpenAI 发布产品的过程,我们可以发现,这确实是一家擅长向大众塑造形象的科技公司。
上周的发布会召开前,OpenAI 究竟会发布什么,众说纷纭。Sam Altman 回应的同时,不忘卖了个关子:
不是 GPT-5,不是搜索引擎,而是一些人们可能会喜欢的新东西!对我来说感觉就像魔法一样。
字里行间,似乎呼应了科幻作家克拉克的名言:任何足够先进的技术,都与魔法无异。
最终,我们都知道了,发布的产品是 GPT-4o,一个实时对音频、视觉和文本进行推理的端到端模型。
短短的 26 分钟里,OpenAI 紧锣密鼓,演示了最重磅和直观的语音和视频交互功能,现场回应网友的问题。
听到酷似寡姐斯嘉丽·约翰逊音色的 AI 和人谈笑风生,低延迟,随时可以被打断,用各种语气讲睡前故事,解答纸上的数学题,为不同语言交替传译,甚至会因为赞美而害羞,熬夜的人们瞌睡都醒了大半。
语音和视频功能还用不上,但 OpenAI 用几分钟塑造了一个 AI 助手的雏形。
当天,Sam Altman 还在 X 发了条动态,只有一个词:Her。
人红,同时也爱蹭。电影《她》(Her)里的虚拟助手萨曼莎,由寡姐配音。她迷人而性感的声音,几乎是整部电影最吸引人的地方,后来也成为了情感类语音助手的代名词。
不难理解,OpenAI 为什么要抱住《她》这棵大树,因为不需要再讲一遍故事,人们自觉地想起这个故事,然后把它和 GPT-4o 相关联。
发布会利索地开完,OpenAI 选择把更多的细节和演示例子留到博客里,让我们自己去翻。
博客一边延续发布会的套路,让演示落地到生活的具体需求,社交局三缺一没事,不懂面试技巧没事,熊孩子教不会也没事......
一边介绍发布会没有重点提及的功能,告诉你 GPT-4o 的图片识别功能挺准确,3D 渲染也很逼真。
即刻上甚至有用户试着让 GPT-4o 挑西瓜和读 X 光片。无需刻意引导,如果用户对你的产品感兴趣,就会发掘出最有趣的用途。
其实 OpenAI 的思路很明确,发布会是面向大众开的,同时他们也知道,大众的痛点和对 AI 的好奇心在哪里。
回到克拉克的那句名言,什么是魔法?
对于大众来说,让科幻电影的功能落地为现实,提供更多 AI 的使用场景,通过免费等方式降低 AI 的使用门槛,融入更多具象的生活细节,其实就是魔法。
领先的技术和好用的产品是挺直腰杆的底气,但保持高调和抢热搜也是重要的。
作为反面例子的 Google,已经被 OpenAI「暗算」过很多次了。
上周,OpenAI 比 Google 的发布会就早一天。今年 2 月,Gemini 1.5 官宣几个小时后,被文生视频的 Sora 抢去风头。
Google当时败在,OpenAI 很擅长吸睛和定义产品。GPT-4o 和电影《Her》深度捆绑,Sora 则打出了「世界模拟器」的概念。
我们还用不上没关系,OpenAI 选择和艺术家们合作,3 月发布的第一批专业级作品惊艳众人。
过了一个月,和 OpenAI 合作的加拿大制作公司 Shy Kids 接受专访时,才更加客观地说明了 Sora 的优缺点,以及他们动用了大量人类后期。Sora 生成的素材和可用的素材比例,大概为 300:1。
OpenAI 涉嫌虚假宣传了吗?也没有,一边适时地推 CTO 和团队出来接受采访,说 Sora 还不是一个产品,预计年内发布,一边在官方 YouTube 发布由 Sora 精心打造的 MV。
偶尔,OpenAI 的营销确实有些过于鸡贼,尤其擅长基于信息差的悬念营造,但也是因为这样,它从来不会淡出媒体和公众的视野。
前段时间,一个测评网站突然冒出一个神秘模型 gpt2-chatbot,大家都在猜测,这是不是 GPT-4.5,Sam Altman 神神叨叨地回应「我对 gpt2 情有独钟」。
上周的发布会之后,OpenAI才摊牌,原来 GPT-4o 就是 gpt2-chatbot。
这是 Sam Altman 擅长的造势套路,他还曾在专访中直言,说 GPT-4「有些糟糕」,既让靠 AI 干活的打工人无言以对,又提高了外界对今夏发布的 GPT-5 的期待值。
Google 在技术上并不慌,但不知怎么,营销总是差了些味道,没有 OpenAI 的存在感强烈,还会犯些破坏形象的错误。
去年 12 月发布的 Gemini演示视频,让全世界兴奋了一下,很快被曝光有剪辑痕迹,实际体验并没有那么丝滑,演示者是基于静态图像帧和文本提示词与 AI 交互,而不是视频和语音,响应速度也被加快了。
今年 Google I/O 开了 2 个小时,发布了不少产品,并非滥竽充数以数量弥补质量,但最终让人记住的,主要是那个和 GPT-4o 差不多的 AI 助手 Astra。
反过来想,面对 Google 这座巨轮,OpenAI 或许也很紧张,所以屡屡剑走偏锋。
Google 的人才、算力、旗下产品多年积累的庞大数据库,都具有显而易见的固有优势,Google I/O 也在往 AI 全家桶的方向发展,深度地将 AI 整合到搜索框中。
正如英伟达高级科学家 Jim Fan 说的,Gemini 不必是最好的那一个,但却可以成为最广泛使用的一个。
可能也因为如此,面对硬实力的 Google,OpenAI 希望把握自己的先发优势,一边坚持力大砖飞的模型,一边尝试更接地气的产品和功能探索,洞察痛点,维持潮酷前卫的形象。
如果用颜色形容,AI 应该是个「冷色调」的技术领域,不管是算法、大模型还是机器人,都给人敬而远之的感觉。
Google 的代表色是蓝色、红色、黄色和绿色,但你对 OpenAI 的印象,可能是那些出镜员工穿着的公司 logo 灰色卫衣、用着的公司 logo 黑色杯子。
其实,除了保留技术的潮感,OpenAI 也希望,他们的形象是平易近人的。
网站是 OpenAI 的产品之一,承载着对外宣传的期望,在我们不会特别留意的地方,OpenAI 同样也下了功夫。
OpenAI 成立于 2015 年,起初是非营利组织,以最有可能造福全人类的方式,开发通用人工智能(AGI)。2019 年,OpenAI 转变为有限利润公司,成立了产品部门。
但可能很少有人知道,从 2021 年 12 月开始,OpenAI 与创意机构 Area17 合作,升级自己的 logo、品牌和网站。
彼时,他们已经决定在 2022 年发布 ChatGPT。Area17 的任务是,让 OpenAI 准备好,成为一家「更加面向公众」的公司。
Area17 的设计思路是「让技术人性化」:从人的角度看待 AI,反映 AI 如何影响人的生活。
体现在网站上,运用了强烈的色彩、抽象的形状,既保留了科技感,又注入了人文色彩,配图主要是两种主要类型:抽象的 AI 生成图片,浅景深的暖色调人像摄影。
最初的排版甚至有些怀旧的报刊杂志风,因为未知容易让人恐惧,设计团队想带给用户舒适和安全的感觉。
设计是传达理念的媒介,无形地影响和塑造用户对产品的观念。
OpenAI 为 ChatGPT 设计的对话界面,思路也是类似的,简单性高于一切,每个交互都不言自明,无需说明书。
同样是语音助手,GPT-4o 和 Astra 的侧重方向是不同的,前者突出「情感」,懂幽默,会害羞。后者突出「助理」,更加谨慎。
然而,就像《她》的 BE 结尾,OpenAI 越宣传自己产品的人性化,越让人怀疑背后的危险。从所作所为来看,OpenAI 似乎也正在背离自己的初衷。
自从董事会的宫斗事件以来,首席执行官 Sam Altman 个人的行事作风就陷入了争议。
上周,OpenAI 首席科学家 Ilya Sutskever 官宣离职,维护 AI 安全的超级对齐团队负责人之一 Jan Leike 出走,外媒 Vox 还曝光了 OpenAI 严苛的离职协议。
GPT-4o 有与寡姐相似的音色,OpenAI 解释是找了另外的配音演员。今天寡姐声明,OpenAI 找过自己,但她拒绝了,并没有授权自己的声音给 OpenAI,已经发律师函让 OpenAI 下架和她相似的音色。
图片来自:X@TrungTPhan
巧言令色,鲜矣仁。
越向成熟的商业公司发展,OpenAI 越无法回应「创建造福全人类的安全通用人工智能」,这个写在他们最初使命里的问题。
正如压碎创意工具的苹果 iPad 广告《Crush》引起的争议,迎接技术的变革和恐惧技术的威胁,两种情绪交织并行,已经是时代的旋律。OpenAI 或许让我们更多地看到前者,但无法控制我们怀疑后者 。
本文来自微信公众号“APPSO”(ID:appsolution),作者:张成晨,36氪经授权发布。
译言 2023-05-20