AGI时代已来,王小川要的不仅仅是中国的OpenAI。(文末附王小川公开信全文)
作者|刘杨楠
编辑|甲小姐 栗子
离开搜狗542天后,低调的王小川以全新的身份和姿态重新回到大众面前。
2023年4月10日下午,王小川召开了新公司“百川智能”的媒体沟通会,正式对外宣布投身AI大模型竞赛。
百川智能是一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。 据王小川介绍, 百川智能公司早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。
对于“百川智能”这个名字,王小川解释道,“百川”不仅和自己有更深的链接,也有“海纳百川”的意味,象征着数据和知识的汇集,也象征着集百家智慧,更多人与其一道共赴山海。王小川也同时呼唤中国的领军人物、行业产品经理和远在美国的同仁可以加入百川智能。
沟通会上,王小川抛出了长达20年的目标。未来20年内,百川智能将借助语言AI的突破完成三大目标:
1.构建中国最好的大模型底座;
2.在搜索、多模态、教育、医疗等方面增强;
3.帮助大众轻松、普惠地获取世界知识和专业服务。
在这场轰轰烈烈的大模型创业盛会中,相比其他入局者,王小川格外低调,就连今天的媒体沟通会,到场的媒体不过10家左右,在靠近清华的一间会议室里,整个媒体见面会的氛围更像是一场围炉而坐的学术研讨会。
在ChatGPT大火之后,曾有人发文直言:“王小川为啥不出来干这件事?他太适合深度参与了。”
与其他AI从业者相比,王小川的经历确实足够光鲜,也足够能让他撑起自己的AI梦:
1996年,王小川获得国际奥林匹克信息学竞赛金牌,头顶“天才少年”的光环进入清华大学;进入搜狐后,在2004年主导推出搜狗搜索,2006年推出搜狗输入法,并在一年之内将搜狗输入法的市场份额从2%提升至40%;2008年,他提出了“输入法-浏览器-搜索”三级火箭模式,成为了搜索行业追赶破局的唯一成功模式;2012年,顺应深度学习的技术热潮,王小川提出了搜狗升级的核心理念,就是围绕着自然交互和知识计算去发展属于自己的核心语言AI能力。
一直以来,王小川始终有无数光环加身——27岁那年,王小川成为彼时中国互联网界最年轻的高管;张朝阳形容他当时的团队“全是精英”,马化腾、周鸿祎一众大佬都曾向他抛出橄榄枝。
但这些并未改变王小川低调务实的本性。
2021年9月24日,搜狗发布公告,宣布与腾讯完成合并。一个月后,同年10月15日,王小川发文告别搜狗,开始探索生命科学。之后两年,王小川并没有太多大动作传出,直到ChatGPT出现。
在王慧文宣布打造“中国版OpenAI”五天后,王小川发了一条微博,他在最后写道:“我相信中国能诞生自己的OpenAI。”
随后曾有媒体向王小川本人求证,是否会回归创业AI大模型。其本人回应:“正在快速筹备中”,之后便没了音讯。留给外界的,是无数真假难辨的传言。
终于在今天,王小川的“百川智能”揭开了神秘面纱。
1.召集搜狗队友,开启大模型新事业
正如外界猜测,王小川此次的新事业,老朋友茹立云确有参与,并也“带资进组”。
茹立云是王小川多年的老搭档。
5年前,茹立云在2018年6月卸任搜狗COO,王小川当时发布内部信时便表示:茹立云在搜狗的创业初期便加入了,是我的事业伙伴、创业挚友。他身上的标签还有:浙江省高考理科状元、清华大学计算机系人工智能方向博士。
茹立云曾参与组建了搜狗搜索研究团队;2010年搜狗公司化运作后,他便成为搜索事业部负责人;2013年他见证与推动了搜狗搜索团队与SOSO搜索团队的合并;2016年升任搜狗COO后,他承担了更多的战略工作。王小川本人还曾调侃茹立云有着江浙人士与身俱来的“算账能力”和“商业头脑”。
除茹立云之外, 团队还拥有包括前搜狗、百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖AI人才。王小川透露,预计在4月底,公司团队规模将达50人。
对此,王小川表示: “公司不能只靠‘拼’明星团队,虽然资本喜欢听这样的故事,但公司其实是一个生命,需要团队的基因交融——先要有一个已经融合好的团队做胚子,也要持续注入优秀人才,不断改良团队基因,才能进化出一家公司来。”
召集团队之后,接下来就是大模型和产品了。王小川在沟通会上透露,目前百川智能的大模型已经开始训练,预计年底发布。
在落地场景方面,王小川认为, to B的调用是更近的落地机会,但长远来看,C端的超级应用则机会更大,并会在未来考虑推出一款“超级应用”。只有超级模型上才能长出超级应用,而超级应用,是接下来更难解决的问题。
商业模式上,王小川认为,未来,互联网传统的广告模式可能被颠覆,高品质的收费服务可能越来越多。
算力方面,王小川表示, A800和A100性能只差5%,算力总会有办法解决,目前不会成为卡脖子的瓶颈。
2.不止于“中国的OpenAI”
如今,大模型混战已经打响,所有人都在擦亮眼睛,想看清谁最有可能是最后的赢家?
在众多大模型团队中,互联网大厂是一支重要力量。
过去两个月,大厂迅速反应,不少大厂的大模型团队直接由一把手亲自坐镇,调动多个业务部门齐力研发大模型。
目前,百度发布“文心一言”及其云服务;阿里发布“通义千问”;华为发布“盘古大模型”;腾讯称正在加速推进大模型 “混元”;字节动作稍有落后,但力度却不输别人,参与部门众多,国内国外均有分布。
而就现阶段的产品效果来看,大厂们发布的大模型产品和ChatGPT还是有肉眼可见的差距。相比之下,一些创业团队的产品反倒更令人惊喜,如MiniMax推出的人工智能助手inspo。
事实上,关于大模型究竟该由谁来做,该怎么做的问题,至今没有共识。
有人认为大厂有钱、有人、有算力,还有多年投入大模型的技术积累,各业务线沉淀的真实的用户数据更是训练大模型必不可少的“养料”。
但不得不说,面对新的技术浪潮,这些主营业务和商业导向并不能直接让大厂轻装上阵决胜AI之战。
大厂往往会受庞大的组织架构和繁杂的业务体系所累,这一点在谷歌身上已经有所证明;而作为大厂的一把手,在让公司长久地活下去和坚持技术信仰的平衡中,技术理想也可能被现实稀释,这一点在百度和李彦宏身上也有所印证。
更重要的是,和前两年火热的Web3.0、元宇宙相比,OpenAI已经验证了大模型的可行性,并提供了更清晰的技术路径;同时, 大模型对人机交互方式的根本性变革,让大模型和千行百业的结合有了更丰富的商业想象。PC时代的微软、移动时代的苹果,均是交互变革的最大受益者。
因此,此次AI大模型的变革,创业公司或许并非完全没有可能。
过去两个月,各界大佬带领的创业团队也来势汹汹,声称要打造“中国的OpenAI”。
按照实现路径来分,大致有以下两路选手:
一路是“务实派”,李志飞、周伯文、蓝振忠、黄民烈等位列其中。他们大多技术出身,认清差距,并敢于接受现实,不钻“通用大模型”的牛角尖,找准场景,以终为始地一边做底层大模型,一边寻找上层应用场景;
一路是“理想派”,这一派的代表性人物无疑是最先挑起热度的王慧文团队。王慧文并非技术出身,但对AI有着不亚于技术派的一腔热血。更重要的是,王慧文在业内有着极强的号召力。此前已经有消息称光年之外正在和国内深度学习框架公司一流科技Oneflow达成并购意向,并与两家孵化自清华NLP团队的初创公司——深言科技和面壁智能商谈并购事宜,这些都让王慧文团队向外界展现出极大的可能性。
王小川属于哪一派?
在两个月前发布的微博中王小川分析:“大厂受自己的业务牵引,追逐资本热点的创业公司更动作变形。不止如此,这种理想主义还需要有爱国之心、商业智慧和学术尊重去获得政府支持,推动企业联盟和学术界协同。”
这段话中涵盖了几个关键动作: 需要技术理想主义、获得政府支持、推动企业联盟和学术界协同。
不难看出,王小川是务实的。
沟通会上王小川透露, 百川智能选择的路径是与大多数国内团队相似的“两条腿走路”方式——通用大模型和垂类大模型同步推进。
百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠地获取世界知识和专业服务。
谈及垂类模型的场景选择问题,王小川表示: “什么行业知识密集,什么行业就是适合大模型首先进入的场景。”
3.理想对阵现实,王小川如何圆梦AI?
如今,站在王小川面前的是强大的对手。如何在有限的资源和激烈的竞争中抢钱、抢人、抢算力,是摆在王小川面前的残酷现实。
如果把OpenAI的成功路径和王小川在搜狗的过往经历对比来看,便会发现二者有着微妙的相似性。
在OpenAI的崛起历程中,微软是不可忽视的存在。2019年,微软向OpenAI投资10亿美元,并将Azure全套基础设施提供给OpenAI训练大模型。今年年初,微软又追加100亿美元投资。
用李志飞的话说,微软几乎“把半条命都交给了OpenAI”。
因此,不少人也猜测,国内的创业团队和互联网大厂能否形成类似微软和OpenAI的“黄金组合”?
值得注意的是,在搜狗时期,王小川辗转于各巨头之间的故事广为人知,而搜狗王小川时代的落幕,也是以腾讯收购告终。
因此,再次创业人工智能,不少人好奇王小川是否会寻找大厂结盟,形成类似微软和OpenAI的“黄金组合”?对此,王小川表示,未来可能会与大厂在云服务方面有合作,但并未透露具体进展。
当然,除了微软鼎力支持, OpenAI的成功也离不开核心团队杀伐果决的执行力。
回顾GPT模型的迭代路线便会发现,OpenAI的“拿来主义”贯穿始终——强化学习、Transformer架构,以及训练instructGPT时,在原有的prompt基础上再次引入instruction tuning的方法,这些构成ChatGPT的关键环节均非OpenAI原创。
出门问问创始人李志飞曾在与甲子光年创始人、CEO张一甲的对话 中表示:“OpenAI的实用主义表现在他们并不是一定要完全按照自己的路线。你可以想象他们每天讨论哪个方法能为我所用的样子,而且要scalable,要能真正有用,不能是那种理论上看起来很漂亮但实际上不能用的东西。 他们自己做的唯一的事情就是scale up。”
巧合的是,如此杀伐果决的实用主义同样存在于王小川过往的职业生涯中。
将时间拉回本世纪初,王小川应张朝阳邀请,为搜狐打造了第一款搜索引擎——搜狗搜索。但王小川很快发现,一个“像病毒网页,美工极其丑陋”的hao123网站几乎占据了搜狐门户70%的流量来源,并在搜狐依然亏损的时候月均收入超过300万元。“这是一种对精英主义的巨大的挑战。”王小川曾评价道。
但王小川并未纠结于此,很快调整战术,模仿Hao123的扩张方法,借助在当时市占率极高的售卖盗版系统光盘的公司“番茄花园”等外部渠道,推广搜狗输入法。2007年,也即搜狗输入法推出第二年,其市场份额就从第一年的2%猛增至40%,2009年达到了70%。
王小川甚至概括说,其在2008年提出的“三级火箭战略”本质就是“番茄花园”和“hao123”的合体,他也由此找到了搜索真正发展的道路。
除了上述因素, 在OpenAI强大的执行力背后,是一则看似极简的技术信仰。正如王小川本人在微博中写道的: OpenAI的成功是一场技术理想主义的胜利。
在最近的一系列采访中,OpenAI首席科学家伊尔亚·苏茨克维(Ilya Sutskever)曾表示,自己早年间参加ImageNet竞赛时便意识到,如果在一个足够大的数据集上训练大型深度神经网络,让这个神经网络去处理复杂任务(比如视觉等),只要坚持训练下去,就能成功。 这背后的逻辑是: 人脑是拥有神经元的神经网络,可以快速处理视觉等复杂任务,可以得出,其它某些神经网络也可以很好地做到这一点。
这个基础逻辑一直坚持至今。直到transformer出现,Ilya便意识到transformer就是能够落实这一逻辑的神经网络架构,GPT模型由此诞生。
同样的, 王小川对AI的热情也不曾间断。
在搜狗时期,王小川便不断尝试将AI引入搜狗输入法和搜索引擎中,他曾不止一次向媒体表示:搜狗不管是做输入法还是搜索,都是跟语言打交道。在AI领域,“语言是人工智能皇冠上的明珠”,语言是最难的一件事情,“我们很愿意在语言上面做更多AI相关的研究”。
对AI的热情背后,实则是王小川对计算机的痴迷。在王小川看来,把自己的想法放进这个程序,这个程序对外界能够形成自己的输出,对外界的变化能够做出自己的判断。所以, 写程序就是创造生命的过程。
如今,大模型的出现又让“创造生命”多了一层现实意味。
沟通会上,王小川分享道,此次创业和在搜狗做CEO的心态有很大改善。“做CEO时更多向外界传递一种完美的状态,但现在创业时不是这样, 我们要认识到自己还有很多不足的地方,还有很多地方需要大家帮忙。我觉得这种心态变化是我自己很大的进步。”
此时此刻,没人知道这场大模型混战的终局会是怎样,但可以肯定的是,每一位躬身入局的创业者,都应当获得一份尊敬。
第一次把自己的名字写进公司名,对王小川显然有深远意味。前路诸多未卜,唯一确定的是,王小川已然又站在聚光灯之下。
END.
附:王小川公开信全文
今天我正式宣布,创建“百川智能”,一家研发并提供通用人工智能服务的中国公司。
生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。多年前我曾断言,机器掌握语言,通用人工智能时代就来了;我也有畅想,搜索的未来是问答。ChatGPT的腾空出世,地动山摇,这一切都开始成为现实。ChatGPT发布到今天,仅仅131天,每天都有扑面而来的新进展、新突破。131天恍如隔世!
大半个世纪以来,科学家们前赴后继,努力创造通用智能机器。这一天终于到来,我们找到了一条巧妙的路径,用AI成功将语言转化成了数学模型。语言是知识、思考、沟通和文化的载体。维特根斯坦说,语言的边界就是世界的边界。当AI掌握了语言后,就开始认知世界,成为有知识、能思考、善表达、会学习的智能体。我把这样的智能体称为“语言AI”。
人类个体总有消亡的一天,但能够将毕生的知识通过语言记录下来供新生命学习、继承,文明因此延续。人类协作也需要个体之间通过语言沟通。掌握了沟通和世界知识的语言AI不再只是人类的“工具”,而将成为我们的伙伴和超级助理,成为人类文明的一部分。
智能时代会改写互联网时代的范式。“ 连接”会被“陪伴”取代,“信息服务”会被“知识服务”取代,“免费与广告”会被“付费与高品质”取代。
智能时代也会改写自工业时代以来的范式。 曾经是专业化社会分工带来规模效应与效率提升,而未来会是逆专业化分工:之前需要很多公司协作完成的工作,会因为AI的赋能“端到端”的完成。
智能时代将再一次开启“文艺复兴”。每个人都会因为AI的助力而变得更加强大。用好AI,一个人就可能做一个公司,解决之前难以解决的难题,也更容易成为自己想成为的人。 社会也会更加扁平,以前少数人才能享有的智力服务,也能更普惠。
告别搜狗后,我已开启新的远征:立志往后二十年,为生命科学和医学的发展尽一份力,为大众健康做出一点贡献,核心路径是构建生命健康数学模型,并已经付诸行动。ChatGPT的出现,也将成为新远征的重要助力。
不仅如此,ChatGPT是我过往经历的延续和升华。2019年我将搜狗的使命升级为“让表达和获取知识更简单”,愿景定义为“帮助每个人轻松地对话和书写。便捷地获得知识和服务,提升工作效率和生活品质”。
搜狗输入法和搜狗搜索的数据制备和产品形态,也与ChatGPT接近。它们都是把互联网上的全部语言数据收集、清洗,压缩成数据库并构建超级产品。随着深度学习的发展,这些产品都多次迭代升级,全面用上了Transformer/Bert等技术。输入法猜你想说什么,搜索猜你想要什么。而ChatGPT把这些能力推到了一个全新的高度,是输入法、搜索之外,第三个把全网数据转化成语言服务的超级产品。搜狗未尽的使命在机器掌握了语言后终于可以实现。
很多朋友认可我的技术理想主义和技术驱动的创业经验,鼓励和支持我做中国的OpenAI。也有很多搜狗和非搜狗的技术大拿,得知我有做大模型的想法,主动申请参与组队,甚至“带资入组”。
我最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。这一次,百川智能将借助语言AI的突破,构建中国最好的大模型底座,并在搜索、多模态、教育、医疗等方面增强,帮助大众轻松、普惠的获取世界知识和专业服务。
筹建百川智能不到两个月,已有多位技术合伙人和领军人物的加入。到这个月底将会有近50人规模的精英团队。大模型的训练也已经启动,进展顺利。按照现在的进度,争取年内发布国内最好的大模型和颠覆性的产品。
我们是中国公司,但我们并不希望只是“中国的OpenAI”,而是能建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。百川也象征着集百家智慧,更多人与我一道共赴山海。我们呼唤中国的领军人物、行业产品经理和远在美国的同仁的加入。
同志们,请通过如下邮箱联系我们:
80@baichuan-inc.com
90@baichuan-inc.com
95@baichuan-inc.com
00@baichuan-inc.com
oier@baichuan-inc.com
通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索“我是谁?”我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。
百川智能CEO 王小川
2023年4月10日
受微信改版影响,没有标星的朋友可能会错过「甲子光年」的推送或是看不到封面,欢迎各位新老朋友给「甲子光年」点个星标⭐️,以便及时收到我们的每篇新推文。
科盛光伏 2024-11-15
天泽智联 2024-11-15
智行合一矩阵营销工具 2024-11-15
米尔MYIR 2024-11-15