人工智能研究公司OpenAI的首届全球开发者大会“OpenAI DevDay”,吸引了业界的广泛关注,甚至被称为“AI界春晚”活动中,OpenAI王牌频出,发布了性能更强大成本更便宜的新模型GPT-4 Turbo、个人定制版ChatGPT(GPT)、助手API以及应用商店GPT Store等核心产品。这些产品到底会如何改变后续AI产业的格局?我们跟踪了许多业内人士第一时间的反馈,他们的反应才能最真实地表达出这场发布会带来的“业界震撼”。
作为全球开发者大会的主办方,OpenAI内部的反应最为迅速。共有三个联创在X平台上进行了发言,角色相当清晰分明,给OpenAI的PR部门加鸡腿。
OpenAI首席执行官萨姆·奥特曼(Sam Altman)的角色就是官方产品发言人角色,在发布会进行期间,他负责在X上简单直白的介绍GPT-4 Turbo和其他新功能。展现出OpenAI一贯向外界展示出的品牌形象:高效,清晰,得体,甚至有点学究气。
而OpenAI联合创始人格雷格·布罗克曼(Greg Brockman)更多的是扮演了开发者支持的角色。他的X页面就欢脱,亲和多了。
他首先感谢了OpenAI团队的不懈努力,并对关注这场盛会的观众致谢。
随后布罗克曼更是深入开发者角色,发表了对开发者大会的感受,他说:“在今天的活动中,我个人最喜欢的部分是通过与智能助手交谈来构建个人定制版GPT。”他还上传了如何使用助手API制作下一代用户界面的视频。看着就好像一般业内人士会做的那样。
发布会的最后部分他开始开发者们加油打气:“人工智能领域有很多东西值得研究,而且绝不会让人感到无聊。”
而在Keynote 结束之后,Brockman一直都在关注和点赞开发者用他们新的GPT所做的尝试和可能,他完美担当了开发者大使角色。
另一位OpenAI的联合创始人,技术大牛安德烈·卡帕西(Andrej Karpathy)的发言则更多是面对产业界的。因此在OpenAI相关人士发言中也最直涉本质。
他表示“有了新近发布的GPT,我认为我们在计算领域看到了一个新的抽象层,尽管它依然显得有些原始。会有更多的开发者,更多的GPT。GPT已经可以读、写、听、说、看、画以及思考,使用现有的计算工具,成为重点领域的专家,参考自定义数据,在数字世界中采取行动,以自定义方式说话或行动,并协同工作。”
这基本上就是OpenAI对新产品的商业 /产品理解解读:把OpenAI的角色向前一步,找到能更多控制产品开发的抽象层。
而这话由Karpathy来说非常合适,因为他之前就因Agent是下一个AI发展点的发言火爆全网。
结合llya前日访谈中多是谈到的更多是AI是否有意识等纯学术问题。扫地僧人设立的岿然不动。
由此,我们从开发者日即可完整窥见OpenAI四大金刚的PR角色设定。
人工智能领域的大咖大多数保持了沉默。另外一些大佬虽然没有明指OpenAI发布会,但根据发帖时间和内容看,还是很容易看出其发言与这场大会的关联。
明确评论的大佬只有纽约大学心理学和神经科学荣誉教授、新硅谷机器人创业公司Robust.AI首席执行官兼创始人盖瑞·马库斯(Gary Marcus)。他先评论了一下OpenAI的新模型Turbo,认为他们最值得关注的是成本和速度,而不是全新的功能。
随后他又爆了个猛料:“考虑到信息检索的截止日期,以及奥特曼在5月份与我们在参议院时所说的话,我的直觉告诉我,GPT-4 Turbo实际上就是GPT-5,只是它还没有取得足够的认知突破,进步也不大。”
这话可以有多层意思解释,考虑到GPT4-Turbo在数据集和训练构架上有一些调整,所以支持更大上下文和更新的知识,也许确实是经过了重训练的版本,也就是实际上的GPT5。但也有可能GPT 5并没有如奥特曼在5月预期的时间完成训练调试,并在这次大会上登场。
纽约大学教授、Meta首席科学家杨立昆(Yann LeCun)作为竞品领袖,推特大嘴王,在发布会结束后回复了一条推特称:大语言模型(LLM)甚至还不知道如何爬楼梯。
最大的AI开发社群Huggingface的CEO Clem虽然没有直接发推评论此事,但转帖了一位创业企业CEO的发言:“OpenAI刚刚给新一代创业公司创始人上了惨痛的一课。我上一次创业是在Facebook和iPhone主导的平台颠覆时代,我为那些第一次创业的人感到同情,他们现在意识到为什么‘护城河’很重要。”
看起来Clem还是本着让大家练好内功的基本逻辑在思考。但其实很多时候,护城河所在就是巨头停步之处。不过这一批被干掉的创企确实是离OpenAI的守备范围过近的企业。
在所有大佬的反应中,特斯拉首席执行官埃隆·马斯克(Elon Musk)最值得玩味。在发布会结束后,他先推继续挺自家AI Grok,之后就去猛打暗黑4杀时间去了。
不知道是不是心有不甘,在当日深夜,他开始放飞自我。开始用可以回答污言秽语的自由,来展示自家Grok的“强大”,并配图嘲讽GPT的“老实”。
但这招并没有被所有人都接受。X用户Tibo就对马斯克行动缓慢提出了批评。他称:“我希望马斯克能做得更好!他可能击败了GPT-3.5,但没有打败GPT-4,仍然比OpenAI落后一年多!”
OpenAI发布的新产品和功能,让许多初创企业心惊胆战。发布会前就有人就调侃:“苹果开发布会,会有很多初创公司看到机会诞生;OpenAI每次发布新产品,就有一堆初创公司死去。”从发布会后的反馈来看,似乎确实如此。而且这次因为GPT的发布,对很多初创公司来讲情况更严峻。
比如说,有一名叫near的创业者发推说:“已经有人问我,我创业公司的哪些人工智能产品没有被OpenAI扼杀?”
对此他解释称,OpenAI在策略上很像亚马逊:等某个项目、服务或商店变得流行时,他们就会推出自己的版本,消除B2B关系,直接面向消费者。这就像让小鱼们先建立市场,然后再占领市场。但它不一定能成为亚马逊。
还有一位AI领域咨询师Abhishek Agarwal 表示“今天,OpenAI在DevDay上杀死了所有类别的初创公司。对于人工智能初创公司的创始人来说,这简直是一场大屠杀。“随后列出来了所有可能面临灭顶之灾的公司类型。
“以下是从明天开始将不存在的一些创业类别:
闭源LLMs: OpenAI推出了GPT-4 Turbo,其上下文长度为128K,价格便宜2.75倍。比如Anthropic、Bard、Cohere
文本到语音API:OpenAI现在提供了一个具有6种类人语音的文本到语音API。比如Eleven Labs、PlayHT
“与你的X聊天”应用程序(一般是PDF,网页文件等):OpenAI现在支持内置RAG。比如Chatbase、ChatPDF、SiteGPT、Cody
矢量数据库:现在GPT API支持RAG,开发者将告别矢量数据库,比如:Pinecone、Chroma、Qdrant
人工智能开发框架:没有人会再使用框架在LLM之上进行开发。后面每个人都会使用OpenAI,因为现在使用助手API构建人工智能应用程序太容易了。比如:Langchain、LlamaIndex“
非常全面,但是可能还得加上一些基础Agent搭建平台,因为通过Actions和升级的功能唤起能力,用OpenAI搭建Agent也是当下最简单,最可能成功的模式。
正如Abhishek所说,不光是小创业公司濒临灭亡。对于其他闭源达模型来讲,OpenAI这次发布会的API价格大降,对他们完全可能构成生死威胁。2/3的价格优势足以打倒任何竞争者。
英伟达资深AI科学家Jim Fan就表示,“OpenAI的规模经济给它带来了杀手级优势,这可以通过计算得出来。使用GPT-4-turbo,阅读整部《哈利波特》系列(共7部)只需15美元,而让它再写7部只需45美元。另外在GPT-4-V上,只需要180美元就可以观看所有8部哈利·波特电影,1帧/秒,分辨率为360p。“
另一位AI创业者Tibo也称:“当我们都在讨论应该如何提高价格时,OpenAI却在一夜之间将其API收入砍了一半!”
不过,对于来势汹汹的OpenAI GPT,这些大受影响的初创公司也不甘示弱。Langchain就在几乎同时放出了对Assistants API的支持。
但是问题是,都有GPT如此方便地搭建支持了,我何必还要跳到你这里做开发呢?
OpenAI GPT刚刚发布,就有AI开发者上手立马用起来了。
AIrundown的Rowan Cheung称其刚刚测试了OpenAI的新GPT Builder,并创建了“X优化器GPT”,它可以微调帖子,并精确定位峰值发布时间,以获得X上的最大参与度。结果令人感到兴奋!
AI应用开发者尼克·多波斯(Nick Dobos)声称自己创建了全球首个定制GPT代理。他认为GPT-4-turbo不够快,所以他包含了20个预构建的热键来加快速度,包括自动保存、长时记忆、可重复使用、跟踪当前任务以及导出到任何聊天应用等。
美国宾夕法尼亚大学沃顿商学院副教授伊森·莫里克(Ethan Mollick)表示,他在不到一分钟的时间里拼凑起来的一个小GPT (Open AI发布的新的类似代理的东西)。它在网上查找产品类别的最新趋势,然后为其创建原型图像。端到端耗时不到90秒!
除了这些基础实验,当天稍晚一点就有人开始做更深度的尝试了。X用户冈萨洛·埃斯皮诺萨·格雷厄姆(Gonzalo Espinoza Graham)试验了人工智能解说的能力。他认为GPT-4V + TTS就可以取代足球赛事解说员。他将足球视频的每一帧都传递给GPT-4视觉预览,并通过些简单的提示要求生成旁白,无须任何编辑。OpenAI的联合创始人Greg还特意为此点了赞。
这还只是Day1,现在的AI领域Geek值指示器可能已经爆炸了。
针对GPT这个产品所带来的基础Agent能力,OpenAI毫无疑问是Game Changer。过往在利用AutoGPT等产品时,因为缺乏对函数引用和外部工具使用的纠错能力,开发成本很高,成功率也一般。因此这些产品虽然GitHub上高星,但一个热门应用都没能从中产生。而GPT之后,事情就会完全改变。
自然语言处理领域专家Sverige_ Dong-seok经常在X上分享有关人工智能的经验。他认为,OpenAI的助手直接把增强语言模型从比拼基准的学术领域解放出来,直给到开发者手中。同时,这也把原本帮助大语言模型更好完成生成任务中间产物CoT变为直接输出再次直给到用户。
同样针对GPT的能力,知名X用户、科技博主苏里·奥马尔(Sully Omarr)认为受伤最大的可能都不是小公司,而是各个行业的巨头。他说:“OpenAI彻底颠覆了整个人工智能领域。许多公司已经花费了数亿美元来构建自己的‘助手API’,现在每个人都可以使用OpenAI的技术。这对小公司来说堪称是福音,但对大公司来说却足够残酷!”
曾经在Facebook和Uber工作过的AI工程师、游戏设计师佩特罗·施拉诺(Pietro Schirano)形容GPT的潜力如同地球物种爆发时期,只不过这次是思想。他说:“创建和共享个人定制版GPT的能力影响将是巨大的。我们正在进入一个新的应用商店时代,一场真正的寒武纪思想大爆发将紧随其后。”确实,在一个用母语就可以通过引导构建自己应用的时代,多少过往受限于技术原因难以达成的梦想会分分钟成真?最起码,千人千面的个人助手已经近在眼前了。
专门研究大语言模型(LLM)的埃尔维斯(Elvis)参与了后续的场次,他分享了OpenAI后续的PPT,称其“很好地总结了大语言模型领域的发展趋势”。
从PPT上看来,目前的GPT API还远不是终点,基于用户体验对知识库和开发工具的丰富,会是OpenAI后续开发的核心逻辑。
最后的趋势观察来自硅谷最炙手可热的设计师之一、私密社交应用Path的主要设计者丹尼·靳翰(Danny Trinh)。他观察的可能不是产品或行业,而是OpenAI CEO 山姆·奥特曼本人。在2008年,奥特曼刚开始构建应用。而到2023年,他已经推出了应用商店。按照这个速度,再过十几年,估计就只有征服银河系够他发挥的了。
本文来自微信公众号“腾讯科技”(ID:qqtech),作者:郝博阳 金鹿,36氪经授权发布。