智东西
作者 | ZeR0
编辑 | 漠影
垂垂老矣的传统搜索引擎,正处在一场全新AI技术风暴的中心。
就在刚刚过去的周末,全球第二大搜索引擎微软Bing悄然上新:集成ChatGPT的新版Bing短暂上线,部分幸运用户已经尝鲜。
与传统搜索引擎不同,Bing的界面不是一条细长的搜索栏,而是一个尺寸更大的聊天框。你输入自己的问题或想查询的东西后,它就会以聊天的方式,直接将答案或建议回复给你。同时,传统的搜索栏选项也依然可用。
▲体验到新版Bing的用户Owen Yin在推文上分享了截屏
用户看到的可能是错误上线的早期版本。这展示了像ChatGPT这样的新式AI聊天机器人与搜索引擎结合后的功能雏形。据传,与仅能回答2021年前数据的ChatGPT不同,Bing版本将能够访问当前信息,微软将在未来几周内正式发布新版改进的Bing搜索引擎。
除了微软外,谷歌、百度等搜索巨头亦在一边投资研发ChatGPT的竞争对手,一边筹备推出类似的搜索引擎“新物种”。按照坊间传闻,百度的新版搜索引擎可能会在今年3月份上线。而谷歌将在北京时间2月8日21点30分举办一场AI活动,说不定会做出对ChatGPT宣战的回应。
▲Google presents活动预告
为了应对ChatGPT的威胁,已退出谷歌日常业务的两位谷歌联合创始人紧急重返公司,多次发起会议商讨对策。谷歌还向研发ChatGPT竞品的AI创企Anthropic投资了约3亿美元。而Anthropic创始成员曾为创造ChatGPT的OpenAI工作。
除了威胁传统搜索引擎外,ChatGPT也正撼动非顶尖程序员们的蛋糕。据外媒获得的一份内部文件,ChatGPT通过了谷歌三级工程师面试,这一职级的平均年薪达到18.3万美元。
还有工程师尝试用ChatGPT改变智能家居体验。上个月,高级Web开发人员Mate Marschalko用短短不到1小时的时间,通过与ChatGPT背后的GPT-3大模型交互,结合Siri Shortcuts做出了一个更智能的语音助手。这个语音助手不仅能控制整个苹果HomeKit智能家居系统,而且能够以超低的延迟响应轻松回答生各种问题。
他给予了ChatGPT极高评价,称尝试过这个产品后,包括苹果Siri、亚马逊Alexa、谷歌Home在内的所有“智能”助手,都显得如此愚蠢而没用。
▲Mate Marschalko演示新智能助手操纵苹果HomeKit智能家居系统
不同于以往AI技术的“自嗨式”落地,ChatGPT正在改变一切主流问答产品的形态。
而这仅仅是个开始。
一、微软拿它商用赚钱, AWS 让它写培训文档
如果你还没试用过ChatGPT,也许很难理解这款AI产品为何会令全球用户如此上瘾,连用两个月还停不下来。
简单来说,因为它真的非常实用,能帮助普通人节省不少脑力和时间成本。
从功能性来看,它可以是一款激起新鲜感的新奇玩具,也可以是一款消磨无聊时光的聊天高手,亦能成为生产力爆表的效率工具,更可以被用作上通天文下知地理的知识宝藏库。
▲ChatGPT能做的49件事(图源:华西证券)
短短两个月,人们源源不绝地挖掘ChatGPT的更多技能,包括替写代码、作业、论文、演讲稿、活动策划、广告文案、电影剧本等各类文本,或是给予家装设计、编程调试、人生规划等建议。
只要你悉心调教,ChatGPT甚至能从擅长套话的“糊弄学大师”快速进化,成为高效学习工具。经过连环追问,它能为你列举出辅助学习的大量书单和资料链接,帮你提炼一篇文章的关键要点、快速掌握一个领域的核心脉络,或是帮你在灵感枯竭时大开创意脑洞。
▲让ChatGPT帮忙列书单
当一款颠覆生产效率乃至引起诸多职业危机感的“新物种”出现,所有科技巨头无不虎视眈眈。
步子迈得最大的是微软。尽管ChatGPT还不完美,偶尔会笃定回答一些似是而非的车轱辘话,或是看似正确实则错误的内容,但微软CEO纳德拉大笔一挥:要在全部产品全线整合ChatGPT。
这个高调的宣言大获成功,令在前沿AI技术领域熄声已久的微软再度成为全球科技圈的焦点。它的激进布局,将回答一个备受关注的问题——ChatGPT将改变哪些互联网产品的运作逻辑?
目前微软已有多类产品计划整合OpenAI技术及ChatGPT,包括Azure云服务、Office办公全家桶、Teams协作会议软件、Bing搜索引擎、Design设计软件、Dynamics 365业务软件等。
也就是说,微软用户很快就能让AI替写邮件、文稿、会议笔记等繁杂重复的标准文字工作。还有消息称,微软可能会在2024年上线的Windows 12操作系统中接入大量AI应用。
此前微软已经用Azure OpenAI服务为其自动编程工具GitHub Copilot提供动力。而ChatGPT将自动编程和检查bug变得更是前所未有的简单,你只要用英文写出自己的设想,AI就能将相应的完整代码送到你眼前。连特斯拉AI前负责人Andrej Karpathy都在推文上感慨说:“英语现在是最热门的新编程语言了。”
其他大型科技企业亦从中分一杯羹。
据外媒报道,亚马逊云计算部门AWS成立了一个小型工作组,经测试发现ChatGPT在回答AWS客户支持问题、求职面试问题、公司战略问题以及编写培训文档等方面做得“非常出色”。
美国元宇宙巨头Meta将通过美国数字媒体公司BuzzFeed从OpenAI的技术中受益。借助OpenAI API,BuzzFeed用AI帮助创建个性化内容,并因此股价大涨。近期Meta向BuzzFeed支付了数百万美元,以帮助其社交软件生成内容。
另据第一财经报道,京东集团副总裁、IEEE Fellow何晓冬称,京东会不断结合ChatGPT的方法和技术点,融入到产品服务中,推动AI的产业落地。
而无论科技巨头们如何进场,一旦ChatGPT取得商业上的胜利,微软大概率会是这些大型科技企业中的最大赢家。
二、巨资押注 OpenAI 背后,微软的失落与野心
上个月,微软宣布向OpenAI追加了数十亿美元巨额投资。据美媒Fortune报道,此前微软已经向OpenAI投资30亿美元。
微软如此看重OpenAI,不惜在宏观经济逆风下继续注入巨资,并如此急切地要将OpenAI的先进技术应用到微软的产品中,究竟是因何而起?
答案或许与微软这些年来在AI研究商业化方面的失利有关。
微软研究院曾长期走在AI研究的前列,但十多年来,无论是发布震惊业界的突破性AI成果,抑或是实现AI研究的商用转化,微软似乎都比其他大型科技企业慢了半拍。
当DeepMind与谷歌这对兄弟公司掀开了深度学习和自动驾驶的落地序章,当亚马逊基于Alexa语音助手的智能硬件生态如蔓草般滋生壮大,当苹果Siri语音助手、文本识别和个性化推荐技术让智能手机的操作变得前所未有的便利,当谷歌BERT掀起全球大型语言模型研究飓风,微软不再是人们列举AI商业成就时首先会想到的名字。
但纳德拉显然不会甘心。
事实上,微软早在2006年就启动了AI与隐私相关的早期研究。自2010年以来,负责语音处理和语言理解研发的部门一直由微软研究院副总裁Peter Lee领导,这些功能被用到Office办公软件和Bing搜索引擎中,为对话转录、语法检查等功能提供技术支持。此后微软一直利用先进的AI技术,潜移默化地改善各类产品的用户体验。
不过,着眼下一个革命性技术研究的微软研究院,更多专注于研发本身,而对商业价值置若罔闻,因此其取得的研究突破并不易直接商用。
正当纳德拉为微软在AI方面的惜败而愁眉难展,一个千载难逢的机会摆在了他的面前——成立短短几年就开发出诸多复杂AI工具的OpenAI,正在寻找融资机会。
▲纳德拉在2022年11月谈到OpenAI和微软的AI产品
在纳德拉指挥下,微软2019年给OpenAI投资了10亿美元,2020年买断了GPT-3背后基础技术的独家许可,从此与OpenAI建立了日益深厚的关系,并换来相当多的优待,包括OpenAI大部分技术用于Bing搜索引擎等产品的优先授权,以及Azure云平台成为OpenAI的独家云供应商。
这个新的联盟很快结出硕果。在OpenAI发布GPT-3大模型后没多久,微软就悄悄地将GPT-3集成到自家产品中,比如改善Office的自动补齐单词等功能、优化语音转文本工具。一位微软高级销售经理称,微软推出OpenAI功能的速度比之前在微软研究院从事AI开发的工具要快得多。
OpenAI也越来越离不开微软的软件和硬件。外媒消息称,OpenAI模型在Azure中占用的空间和计算比微软语言模型Turing-NLG更多。
▲一些大型语言模型的参数规模对比
对于像大型语言模型这样的计算密集型开发,降低成本至为关键。假设每月有1000万用户,每天运行ChatGPT的成本估计高达100万美元。纳德拉曾透露,微软已经建造了一台超级计算机来处理OpenAI的工作,能以竞争对手一半的成本处理一些AI计算。
除此之外,由于微软是OpenAI最大的投资方,在OpenAI推出每月20美元的ChatGPT Plus订阅服务后,OpenAI从ChatGPT收到的商业报酬越多,也就意味着微软能获取更大的回报。OpenAI预期今年收入将达到2亿美元,明年达10亿美元。
据外媒报道,微软最多可以持有OpenAI超过1/3的股份。OpenAI一旦开始盈利,在返还First close partners(FCP)后,75%的盈利将回报给微软,25%的给员工和FCP。然后,2%给OpenAI非盈利机构,41%给员工,8%给FCP,49%给微软。待各方都达到收益上限,100%股权全部返回给OpenAI的非营利机构。
▲OpenAI投资回报结构(图源:Fortune)
不过,金钱上的回报只是蝇头小利,真正潜藏的巨大价值在于ChatGPT在短期内聚集的庞大用户,数百万用户的试用反馈将OpenAI的先发优势如同滚雪球般越滚越大,促使它成为ChatGPT类产品的规则制定者。
这也就不难理解为何很久“两耳不闻公司事,一心专注搞慈善”的微软创始人比尔·盖茨也给予超高评价,称像ChatGPT这样的AI技术,重要性不亚于PC(个人电脑)和互联网。
今天,随着OpenAI研发的飞速突破,微软的野心已经不可同日而语。
微软想要将包含ChatGPT在内的基于GPT-3.5和GPT-4的更高级功能,加入Azure、Office、Teams、Bing等产品,从而继续主导信息时代的生产力工具。
▲纳德拉透露计划将ChatGPT加入Azure OpenAI服务
为了尽快达成这些目标,微软已经将OpenAI研究人员调往微软产品组,以加快实现商用创收。
三、谷歌迎敌:投资 OpenAI 对手、测试 ChatGPT 竞品、设计新搜索页面
ChatGPT背后的OpenAI,正因其惊人的创造力与人才密度,引起全球大型科技企业的警惕。
这家开发出GPT-3和ChatGPT等里程碑式AI产品的公司,截至今年1月24日只有区区375名员工。上线仅两个月,ChatGPT的月活跃用户数已经突破1亿大关,是史上最快的消费类应用。
首当其冲的,便是在云计算、AI和搜索引擎领域都与微软狭路相逢的谷歌。为此,自2019年离开公司日常工作的谷歌创始人拉里·佩奇和谢尔盖·布林上个月重返公司,接连举行多次高管会议,强调应对ChatGPT的紧迫性。
有趣的是,谷歌似乎打算模仿微软的策略。
谷歌已向从研发ChatGPT竞品的AI创企Anthropic投资约3亿美元。Anthropic成立于2021年,其创始人Dario Amodei曾担任OpenAI的研发副总裁,因对OpenAI发展方向存在分歧而离开。
目前Anthropic团队规模约40人左右,多数成员曾参与过GPT-2、GPT-3模型的研发,目标与OpenAI如出一辙——要构建可靠、可解释和可操纵的通用人工智能系统。
▲Anthropic CEO Dario Amodei
今年年初,Anthropic公开了其直接对标ChatGPT的聊天机器人Claude。而谷歌是目前其唯一公开披露的合作伙伴。
在谷歌参投前,Anthropic已融资超过7亿美元,包括1.24亿美元A轮融资、5.8亿美元B轮融资。根据外媒的报道,最新的3亿美元投资由谷歌云牵头主导,并与Anthropic签订了一份大型云合同,将在谷歌云上部署Claude。交易完成后,谷歌将持有Anthropic约10%的股份。
和微软OpenAI联盟类似,这种合作伙伴关系是一种双赢之举,云计算巨头能深入了解初创公司的技术与人才,初创公司不必为构建基础设施而花费巨大开销。亚马逊亦与AI绘画独角兽Stability AI组成联盟,AWS成为这家创企构建和训练AI内容生成模型的“首选云合作伙伴”。
不同之处是,微软与OpenAI签的是“独家供应”,关系绑定地更紧密,而谷歌与Anthropic、亚马逊与Stability AI的交易都不具有排他性,两家创企均可以自由地与其他云供应商合作。不过考虑到构建大模型需要稳定的硬件,AI创企选定云平台后,通常不会想在不同云平台之间迁移。
另据一份内部文件,谷歌最近测试了多个AI聊天机器人,包括ChatGPT。根据回答情况,谷歌团队认为ChatGPT的水平达到了三级工程职位,这一职级的平均总薪酬约达18.3万美元。
谷歌云正启动一个为Atlas的“红色警报”项目,以应对ChatGPT的威胁。另一个产品部门一直在测试一个可使用问答形式的新搜索页面。此外,谷歌还在测试一款采用谷歌对话AI语言模型LaMDA的聊天机器人Apprentice Bard。
Apprentice Bard和ChatGPT功能类似,待用户在对话框输入问题后,能够以更像人类问答的形式给出对应问题的详细答案。并且也如嵌入ChatGPT的新版Bing那样,Apprentice Bard据说能回答最近发生的事件。
不过其回答的可靠程度仍有待提升。一个在谷歌内部流传的例子是,有位测试人员问Apprentice Bard:谷歌是否会进行又一轮裁员?
它回答说:“根据我的数据库访问,谷歌不太可能在2023年进行又一轮裁员……裁员通常是为了降低成本和结构,但公司财务状况良好。事实上,谷歌的收入在2021年增长了34%,公司股价自2022年1月以来上涨了70%。”
然而真实的情况是,2023年1月,谷歌宣布裁员12000人,占其员工总数的6%。
屡屡卷入AI道德舆论风波的谷歌,对新产品的发布显然更为谨慎。谷歌AI负责人Jeff Dean此前曾告诉员工,谷歌有能力做出媲美ChatGPT的产品,之所以迟迟不愿发布,是因为担心这类产品会因提供错误信息等缺陷而影响公司商誉,因此比“小型初创公司更加保守”。
而ChatGPT卷入的一系列风波,也印证了这些担忧绝非杞人忧天。由于ChatGPT生成的错误答案被大量搬运到Stack Overflow等编程问答社区,Stack Overflow被迫宣布禁用ChatGPT。此外许多学生尝试用ChatGPT作弊或者代写论文,令美国大中小学的老师们头疼不已。
正如AWS首席技术官Werner Vogels的评价:“它(ChatGPT)并不关心真相,而只是将令人信服的文字组合在一起。”
但紧迫的形势已经逼得谷歌无法再等下去。“我们将大胆地开展这项工作,但要怀着强烈的责任感。”谷歌母公司Alphabet的CEO桑达尔·皮查伊说,谷歌将在“未来几周或几个月”推出类似ChatGPT的大型语言模型LaMDA,用户很快就能以“搜索伴侣”的形式使用该模型。
▲Alphabet CEO桑达尔·皮查伊
毕竟,作为全球最大的搜索引擎巨头以及AI领域的先驱企业,谷歌恐怕很难眼睁睁地看着竞争对手利用一个创新AI产品撼动自己的利益蛋糕,也很难不介意一个先进AI技术的话语权掌握在竞争对手的手里。
结语:欢迎来到生成式 AI 时代
如果重返一年之前,AI产业还是霜寒遍野,持续投入巨资却难以创收的研发成本令科技巨头和创业公司都背负着沉重的压力。
AI医疗先驱IBM沃森健康业务大规模裁员,特斯拉、Waymo的全自动驾驶进展缓慢,计算机视觉和语音处理的头部企业们也迟迟未觅得能带来巨大商业回报的道路。
一切变局始于去年。以AI绘画与ChatGPT聊天机器人为代表的生成式AI产品,凭借足以顶替人类画手和知识问答专家的强大实力,正为AI产业注入一抹全新的商业化曙光。
无论是绘画师、程序员还是新闻工作者,都因这一技术的风靡而心生警惕。这个颠覆想象力的AI作品,带来令人兴奋的生产力跃迁,但也带来了一些令人难安的潜在风险。
一方面,生成式AI存在剽窃文章、代码、图像、视频等人类作品版权的可能性;另一方面,它一旦被心怀不轨的人利用,就会变成一个给全世界造成混乱和危险的“按钮”,大大降低了制造虚假信息、作弊、伪造图像乃至视频等的门槛。
随着生成式AI走向商用,潘多拉的AI魔盒已经打开,一切都充满未知数。