本期紧接上篇《OpenAI 商业脉络全梳理,微软这次偷谷歌老家会成功么? 》,本期专题介绍 OpenAI 当前的投资版图,分为三部分:
OpenAI 早期由 Elon Musk、Sam Altman 以及 Greg Brockman 等人于 2015 年成立于旧金山,是 AI 模型 GPT-3、DALL-E 2 以及 AI 对话产品 ChatGPT 背后的独角兽,近期估值 290 亿美元,对 OpenAI 不太了解的朋友可以阅读上期文章《OpenAI 商业脉络全梳理,微软这次偷谷歌老家会成功么? 》。
关于 OpenAI Starup Fund:2021 年,OpenAI 发起了总金额为 1 亿美元的 AI 创投基金,背后的 LP 包括微软和其它合作伙伴,OpenAI 希望投资于 AI 技术可以产生变革性影响的行业,特别是在医疗保险、教育、气候变化以及工具等领域来提高生产力,基金目前的负责人是下图左一这位帅哥👇, OpenAI 的 COO Brand Lightcap,他也是前 YC 孵化器的投资人。
OpenAI 鼓励来自各种背景、学科以及经验水平的工程师、设计师、研究人员以及产品人员加入到这个活动中,而对创始人在 AI 相关工作经验不做要求。
关于 Converge:2022 年 11 月,OpenAI 宣布推出名为“Converge”的加速器计划,为早期 AI 初创公司提供资金以及独家技术资源,被选入该项目的 10 家企业,将获得每家 100 万美元的支持,以及为期 5 周,每周大约 6 小时的机会与 OpenAI 工作人员一起办公研讨,此外还能访问 OpenAI 的最新模型与定制应用。
目前看来,OpenAI 走了 OpenAI Starup Fund 和 Converge 两条路线,被投企业在获得资金支持的同时,也将获得微软 Azure 的资源;话又说回来,除了 OpenAI 的 Converge 项目,目前专注 AI 领域的孵化器并不太多,目前美国比较垂直且有一定知名的有:
根据 CEO Altman 和 COO Lightcap 在官网上的介绍和论坛交流中获取的信息,我对创业者们的提问进行了梳理, FAQ 摘要如下:
截止 2022 年 12 月 日,OpenAI Startup Fund 披露的投资有 4 个项目,分别是 Descript、Harvey AI、Mem 以及 Speak,它们分别在重塑创造力、法律服务、生产力以及教育领域有着很大潜力,通过深度结合尖端 AI 模型来为用户创造新的产品体验。
2022 年 10 月,Descirpt 完成了由 OpenAI Stratup Fund 领投的 5000 万美元 C 轮融资,估值 5.5 亿美元,Descript 的创始人& CEO Andrew Mason,此前也是 Detour、Groupon 两家公司的创始人& CEO,更早之前他还创办了一个社交媒体平台 The Point,此外 Andrew Mason 还是 YC 的兼职合伙人。
那么 Descript 是一款怎么样的产品呢?Descript 创立于 2013 年,是一种协作式音频和视频的 SaaS 编辑工具,支持将音频转录为文本文档进行编辑,它还为语音音频文件提供自动和手动转录解决方案;此外,该平台利用语音识别技术在短时间内转录音频和视频文件。
OpenAI 在官方介绍中表示 Descript 通过 AI 重塑了创作者与内容互动的方式,任何人可以像编辑文本一样编辑视频,当时投资 OpenAI 的时候正逢 Descript 发布 Stroyboard,一种类似幻灯片那样直观的界面(如下图👇)。
对于用户而言,可以通过编辑文本来编辑音视频,而不是通过以往的轨道或者波形,这款产品也不局限于一种内容形式,它也支持解说视频、销售演示、播客、社交媒体帖子,甚至是发给朋友的视频消息。
在 AI 应用体验上,Descript 创建了创作者声音的克隆,也就是说通过输入想表达的文字脚本来生成个性化音频,另外还有自动填充次删除功能以及用于降噪的 Studio Sound 功能,这些也都由背后的 AI 支持。目前,已经有很多海外的播客节目通过 Descript 进行制作,包括 Youtube 以及 TikTok 上的创作者,企业用户也会通过制作不同的内容形式满足商业用途。
Andrew Mason 在分享合作伙伴 OpenAI 时表示,以往像 Descript 这样的初创公司可能会在创业头几年就处于亏损之中,为了保持运营和发展而对外融资,而这之中也会存在一些业务上的冲突,而 OpenAI 的核心是通过 AI 来生成内容,例如 Descript 产品中的文本、图像以及视频,一些企业用户会借助 GPT-3 模型来生成一些营销文案,也会通过 DALL-E 2 模型来制作一些图片,并且这些还处于快速迭代中,2023 年 Descript 还将基于 OpenAI 的技术推出一些新工具。
Harvey AI 是一家被称为“律师副驾驶”的初创公司,在去年 11 月份 OpenAI Startup Fund 领投了该项目 500 万美元,同时参与这次融资的还有 Google AI 负责人 Jeff Dean、Mixer Labs 联合创始人 Elad Gil 以及 ex Greglock 的投资人 Sara Guo 等早期投资人的投资。
Elad Gil 此前描绘了他对这波 AIGC创业浪潮的看法,感兴趣的童鞋可以翻阅之前更新的这篇文章👉《ChatGPT 发布,新一波 AI 创业浪潮 |AI 创业公司这次可以和巨头扳手腕了么? 》
回到 Harvey AI ,两位创始人一位是律师,另一位是 AI 科学家,互为室友关系🧑🤝🧑。有一天科学家室友向律师室友介绍了 GPT-3,律师室友顿悟了他的 aha-moment,并意识到了 GPT-3 可以为律师工作流程提供一个基于自然语言的交互界面。
关于这两位创始人的背景:
那么,具体而言是怎么样的呢?用户无需动手编辑法律文件或者进行法律俄研究,而是通过简单的语言描绘希望完成的任务,并收到结果,这个过程有点像律师向神龙许愿,神龙直接丢结果给你的场景。
举个例子,“告诉我XXX法院的员工和独立承包商间的区别是什么”、“告诉我合同中某个条款违反了XXX法律了么,如果是请帮我修正”。
这一语言交互的背后则是通过语言生成模型进行支持, AI 会把研究、起草、分析以及沟通等繁琐环节进行压缩与提效,结果是帮助律师从业者节省了更多时间,也为 Ta 们的客户提供了更高质量的服务,而产品使用的门槛则是简单的语言描述,而非复杂的工具,这也减少了用户的学习和使用成本。
当然任何事情都有正反面,由于法律纠纷有高度敏感性,律师和律所可能并不会完全开放访问案件的权限给 Harvy AI,其次是受众的问题,仅面向持牌的律师在监督下使用,而不是非专业的用户,这也是 Harvy AI 需要去解决的。
目前,Harvey AI 有一个 5~10 人的团队,产品还处于测试阶段,感兴趣的童鞋可以关注一下这个网站👉:https://harvey.ai/
对于项目投资,OpenAI 的 COO Lightcap 表示 —— Harvey AI 将对现有的法律体系产生变革影响,律师从业者借助 AI 可以更有效地提供高质量法律服务,Harvey AI 的使命是“如何通过 AI 增加法律服务的边界并改善服务结果”,这也符合 OpenAI 的投资理念,两位创始人除了获得资金以外,还可以提前访问微软最新的 OpenAI 系统与 Azure 资源。
知识工作自 18 世纪末工业革命初期仅局限于少数专业领域,再到 20 世纪中期信息时代兴起,知识工作成为现代经济的一个重要特征,人与信息的关系产生了巨大变化,Mem 认为今天正处于新时代的边缘,机器不仅可以自动化(工厂)和加速(互联网),还将实现思考和推理。
2022 年 11 月份,Mem 宣布完成由 OpenAI Starup Fund 领投的 2350 万美元 A 轮融资,投后估值 1.1 亿美元,融资总额达到 2900 万美元,Mem 也将同样获得最新的 OpenAI 访问权限以及微软 Azure 等资源。
Mem 由 Kevin Moody 和 Dennis Xu 于 2019 年一同创立,Moody 和 Xu 既是同期斯坦福 CS 本科同学,毕业后也都分别在谷歌和 Yelp 担任同样的职务——产品经理。
两位产品经理将 Mem 定位为一款来自加州的轻量化知识管理工具。Mem 的使命是连接世界信息孤岛,释放人类的集体智慧,即通过会思考的 AI 来构建和激发人类,去创造更多更好的想法以及更少组织的产品,官方主打 Self-organizaing Workspace 的理念,即所有的知识工作都将围绕一组共同活动展开,具体而言 Mem 会将来自个人、团队以及企业的知识结合在一起,从而提供系统性的能力和决策。
在传统场景,人们寻找信息、线索和灵感,随后进行综合、分类与存储,而随着时间推移,这些知识资产会产生新的想法和认知,并循环往复,典型的场景有研究人员要阅读大量的 arXiev 论文,投资者要阅读冗长的 10-Ks,以及创作者要细读大量的剧本,这些工作单元有很多共性,而每项活动都是开头这些循环动作的微小变形,而结合特定知识以及推理能力的 AI,可以为这些工作者创建个性化的知识助手,这就是 Mem 想要做的,从个人信息/知识管理切入,从而构建一个关联知识图谱,逐渐演变成一个私人 AI 助手。
而与传统知识管理工具相比,Mem 依旧强调轻量化,支持快速记录、搜索、标签、标记其它用户以及循环提醒功能,用户可以通过短信、社交工具以及客户端等不同途径,不同内容形式(如文本、链接和图片等)来收集用户生活中的碎片化信息,当你在 Mem 的收缩功能中进行搜索时,它便能根据描述分析特定的时刻、场景或者是人物。
在最近的产品更新中,Mem 还完善了其内置的「Mem X」工作助手(X代表付费计划),新增了智能写作和编辑等新功能,根据文字描述让 AI 完成例如内容文本生成、总结文件、编写文案以及调整格式等需求。
深挖 Mem 产品的背后,其借助了 OpenAI 的嵌入模型以及 Pinecone 的矢量搜索来作为 MemX 的底层能力,例如用户在 Mem 中进行搜索,通过对话一般的自然语言叙述,Mem 能够理解用户输入的语义并找到最相关的结果,未来 Mem 还希望能够自动梳理一个团队/组织内的所有信息,包括从员工信息再到客户数据、内部文件、研究、邮件、Slack 信息以及更多,可谓是野心不小。
那么问题来了,大家觉得同样的使命愿景,市面上哪款 SaaS 产品会更有机会呢?
Speak 是一个通过 AI 帮助人们学习英语的平台,它为用户提供了与母语人士进行真实对话的体验。韩国是 Speak 第一个选择进入的市场,并在推出的 1 年内获得超过 100 万次下载,先后获得 App Stroe 和 Google Playstore 教育类目的第一名。
Speak 由 Connor Zwick(CEO) 和 Andrew Hsu (CTO)创立于 2016 年。去年 11 月份,Speak 对外宣布了 2700 万美元的 B 轮融资,仍然由 OpenAI Starup Fund 领投,Lachy Groom、Hosh Buckley、Justin Mateen、Gokui Rajaram 和 Peter Thiel 背后的 Founders Found 跟投。
Connor Zwick 可以说是一名天才少年,在 17 岁高三时期开发了一个款卡片学习工具「Flashcards +」 ,在当时获得超过 100 万次的下载量,随后卖给了上市公司 Chegg,而后在 19 岁时被哈佛和 YC 孵化器录取,而后从哈佛休假出来尝试创业,并成为了 Thiel Fellowship 的研究员;另一位 Andrew Hsu 在 16 岁华盛顿大学获得三个学位,而后在斯坦福大学神经科学博士学位退学后出来创业,通过Thiel Fellowship 项目认识了 Zwick 一同创立了 Speak。
再来聊聊 Speak 这款产品,App 中所有的课程学习材料来自其美国洛杉矶的工作室制作,这保证了其内容的实用性与时效性,而不是电视节目中的老材料,而在产品的内容形式上设计了其专有格式 Spic,通过不到 10 分钟的短视频来与用户进行眼神+对话交流。
新功能 AI Tutor 提供 90+ 真人角色扮演以及 120+ 学科小节,通过与 AI 实时对话,让用户自然地学习同等场景下的英语交流。
Speak 背后的自动语音识别模型是结合母语人士的英语口语数据与超过 100 万韩国用户口语数据而创建的结果,能够准确识别韩国用户的语音发音问题,并以小于 0.1 秒的速度和 95% 的准确率来支撑其产品,每天有超过 10000 分钟的海量语音数据来优化其 AI 模型。
用户的声音语料数据经过 AI 模型识别,然后即时转换为音标,并进行逐个音素分析,识别的结果将整理后反馈给用户。Speak 的 CEO Zwick 认为 10 年后人们学习语言的方式将会与今天完全不同,人们将通过手机通话来学习语言,即使他们不与母语人士互动。
目前,Speak在韩国 iOS AppStore 教育类排名第一,超 10 万名活跃用户,营收上主要通过按月/年的方式收取订阅费用,ARR 超两位数。
OpenAI Starup Fund 对于 Speak 的 B 轮投资,将帮助 Speak 更快将产品复制到东南亚以外的市场,例如日本,这笔资金也将投入到研发、产品和运营工作中。OpenAI 的 COO Lightcap 认为 Speak 为非母语学习者提供了强大的生成式 AI 学习内容,让语言学习更有效更易得,还有可能影响更广泛的教育领域,这也符合 OpenAI Starup Fund 借助 AI 改善人们生活的目标。
本文来自微信公众号“江天Tim”(ID:gh_ca2ac8df4da8),作者:TimJ,36氪经授权发布。