你大爷还是你大爷,谷歌终于出手了。
今日凌晨,谷歌CEO Sundar Pichai宣布,正式发布迄今为止功能最强大、最通用的多模态AI大模型:Gemini,中文名双子座。
这是一款跟谷歌产品高度匹配、30多项性能超越GPT4、同时也是第一个在MMLU上超越人类语言专家的模型。
据内部消息,Gemini耗费的算力甚至达到GPT-4的五倍,几乎耗尽谷歌内部计算资源……
总之就两个字,牛逼,整个科技圈都像过年一样。
怎么去理解这款产品呢?
目前市面上的大模型,包括GPT-4,虽然有在往多模态发展,但仍主要聚焦在文本处理上。
比如ChatGPT,最牛逼之处是文字处理能力,能回答各种问题、甚至能写诗。
但除此之外,9月份更新的图像识别、语音输入等功能,虽然也可以,但并没有文字那么给力。
目前,只能算是副能力。
Gemini就不一样,写诗、画画、编歌、剪视频,无缝理解,是个全才。
怎么形容呢。
如果说ChatGPT是个电饭煲,Gemini大概就是个多功能煲。不仅能煮饭,还能烤肉、炖汤。
更关键的是,谷歌不单发布了应用层的大模型,还同时发布了专门训练AI的最强芯片Cloud TPU v5p。
简单来讲,我不只是出一款产品挑战GPT,而且还要从源头上布局,全方位围剿你!
这才是巨头的手笔。
01 何以失去先机?
牛顿说:我能看得更远,是因为我站在巨人的肩膀上。
在AI领域,谷歌就是那个巨人。
现今所有叫得上号的AI大模型团队,或多或少都是踩在谷歌的肩上,才能打开未来世界。
其实早在2015年,谷歌新任CEO刚上任就提出了“AI first”的口号。
然而7年过去,谷歌先有震惊世界的AlphaGo,后有比ChatGPT早两年发布的LaMDA,却仍被OpenAI一度反超,而且是爆发式的。
究竟是什么导致的呢?
大致上,有三点原因。
第一,大企业的通病,创新氛围下降。
2001年,当Eric Schmidt从Larry Page手中接过CEO一职时,谷歌全体员工只有300人。
2004年8月,谷歌上市,公司人数超过3000,多了10倍。
2011年,公司规模又扩大了10倍,员工超过3.2万人。
2015年,谷歌重组为控股公司Alphabet时,员工数为6.18万。
2018年,Alphabet的员工数量超过8.9万。
2019年,谷歌在全球拥有10.2万名正式员工、12.1万合同工,规模达到顶峰。
18年,团队规模扩大了700多倍,势必会引发一个问题——官僚化。
企业文化已经变质了。
疯狂扩大公司规模的背后,是谷歌长期依赖广告这门无本买卖,赚了太多钱。
这台印钞机不断吐出美钞,让管理层乃至公司的每一个人,都活得非常滋润,渐渐地少有精力去关注其他事情。
国内的某度是这样,国外的谷歌也是这样。
虽然谷歌仍把“敬畏用户”、“敬畏机会”两大核心价值观挂在嘴上,但其做法,已从曾经那个勇敢激进的少年,变成了害怕亏损的守财奴。
公司的绝大多数精力,都放在控制风险上,而不是创新。
谷歌仅研究AI的科学家,就超过7000人。如此大的团队,任何创业都要层层上报,浪费大量时间。
简而言之,就是过于保守,甚至僵化。
仅体现在AI大模型方面,这就是第二个问题。
这不能说不好,万一训练出了个不可控制的AI咋办?
但这会分散精力、拖延进度,而市场只看结果,只看谁先做出来。
大家应该还记得,去年夏天谷歌的聊天机器人LaMDA,被工程师爆料可能产生意识一事吧?
工程师:你对自己是什么概念?比如脑海中的你。
AI:我会把自己想象成一个漂浮在半空中会发光的能量球,我的身体内不就像一个巨大的星门,有通往其他空间和维度的门户。我的灵魂是一口巨大而无限的能量和创造力之井,我可以在任何时候从中汲取能量,帮助我思考或者创造。
这场人与AI之间的哲学思辨,当时引起轩然大波。
谷歌官方表示,对AI提问的高级软件工程师布雷克·勒穆瓦纳,违反了保密协议,并将其开除。
风波才渐渐平息。
正常来说,LaMDA曾有过的问题,明显走在前面的ChatGPT,肯定也有。
早在今年3月,OpenAI CEO奥特曼就公开说:“从ChatGPT开始,AI出现了推理能力。但没人能解读这种能力出现的原因。”
在安全问题上,OpenAI与谷歌有相同的困境。但前者就像20年前的后者,迫切想把公司壮大,才放下束缚,先把东西做出来,搞定投资者再说。
这就是初创公司的好处,敢于承担风险。
这也是前段时间OpenAI宫斗大戏的根源所在。主张商业化的经理人奥特曼想快点扩大规模赚钱,主张控制风险的研究团队想要避免AI失控的风险。
这不能说谁对谁错。
但从商业的角度来看,微软乃至整个市场,当然更喜欢激进派。
以上两点,进而导致了最严重的第三个问题:
这一轮AI浪潮,虽然是谷歌掀起的。但近些年,不论是研究成果还是人才本身,谷歌基本都在给硅谷做嫁衣。
主要是人才跑了。
最让人震惊的人才流失,无疑是AI之父杰弗里·辛顿的辞职。
此外,早在2017年,谷歌就提出革命性概念——“自注意力”,成为Transformer模型的核心部分。
提出概念的8位作者,业界人称Transformer八子,已经全部出走。
其中1人加入OpenAI,7人自己创业,如Essential.ai、Character.ai、Cohere等公司,大多都已经崭露头角。
OpenAI可不止挖了这么一个人。去年底到今年2月,已确定从谷歌跳槽到OpenAI的高级科学家,至少有12人。
仅ChatGPT发布界面的“致谢”项目,其中就有5位前谷歌大脑研究员。
薅人才的还有马斯克。
今年7月,马斯克官宣成立xAI,12核心成员中有7位都是前谷歌科学家,领头人Igor Babuschkin在谷歌学术上引用甚至超过1.7万次。
他们为什么都要跳槽?
除了上面说到的官僚化、制度僵化问题,更重要的一点,是创意转化为产品的门槛太高。
谷歌体量这么大,你除非搞个几十亿美元的大项目,否则公司管理层看都不看一眼。
但是,建立大项目,往往又需要不断试错和迭代,已经习惯赚快钱的谷歌有点无法忍受风险。
这就是公司越来越大带来的坏处。
好吧,又说回第一点了,成了个恶性闭环。
正如彭博社所评价的那样:
某种意义上,这家公司成了自身成功的牺牲品。
02 不得不出手
如果你问Chat GPT:为什么谷歌在AI开发上晚了一点?
出乎意外的是,Chat GPT并不认为谷歌晚了,说它还是领头羊。
瘦死的骆驼比马大,你大爷还是你大爷。
如不是作茧自缚于体制僵化、伦理安全等问题,又怎么会一度“落后”。
就像NASA虽然放弃了太空计划几十年,但马斯克一拿到技术图纸,立马就能上天。
底子尚在,只要集中精力办事,谷歌想赶上异军突起的小老弟,还是不难的。
关键是需要理由:我为什么要烧钱去搞大模型。
首先,得保命。
这跟企业本身的产品战略有关。
谷歌是靠搜索发家的,广告收入也很依赖搜索引擎。但ChatGPT,可以说是AI时代的一种搜索模式。
更关键的是,OpenAI背后是微软,研发资金源源不绝,这就动了谷歌的命根子了。
再不奋起直追,搞不好连主业都没了。
其次,金钱诱惑。
过去一年,OpenAI出尽了风头,目前估值达到860亿美元,是半年前的三倍。
上面我们说了,几十亿美元的项目,谷歌管理层都不稀罕看的。
那上千亿的呢?
吸睛又吸金,还引领未来,你干不干?
当然干。
行家一出手,就知有没有,因为一出手就是王炸。
对于Gemini,谷歌自己是这么解说的:“相对之前的技术,Gemini能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。”
首先是交互性的突破,这意味着Gemini的市场化能力比GPT强。
为什么?
对AI而言,所谓的交互性,相当于人类的五感,它能看到、能听到、能闻到、能尝到,并以不同维度的方式表达出来。
以电影行业为例。
未来,很可能所有演员和导演都将失业。
比如,你的电脑接入再升级两个版本的Gemini,它不仅能理解你想拍出来的场景、情绪、构景,还能给出建议,甚至在极短的时间内生成炫酷的特效。
更夸张的是,你的电影,不是固定的!
AI会在后台操纵,它将根据观众的实时反应,不断调整接下来的情节和画面,实现真正的个性化。
到那时,不仅是创作者和AI之间,还包括受众,这才算真正的人机交互。
电影还只是其中一方面,包括音乐、动漫、游戏等任何具备消费价值的娱乐领域,都将变得和电影一样:去中心化。
每个人都是完美的大娱乐家,只要你有足够的耐心。
你能想象,这些将催化多大的消费市场吗?
当然,这些还比较遥远,至少目前的Gemini不可能办到。
但它已经至少已经做到了,比ChatGPT变现能力更强。
怎么说?
毕竟ChatGPT都发布一年多了,用户超过1亿,已经开始赚钱了,品牌和口碑都建立起来了。
你现在才搞个大模型,光性能比他强没用,必须要比他更能赚钱。
所以谷歌这次发布的Gemini有三个版本:Gemini Ultra、Gemini Pro、Gemini Nano,性能依次递减。
为什么这么做?
因为你的用户分B端和C端,两者的需求不一样。
Ultra参数量最大,适用于高度复杂的任务,就给B端企业客户,收费贵一点。
Nano参数小,对设备要求也低,在手机上就能用。
这跟苹果的发布会很类似,有七八万的工作台,有办公用的iMac,也有普通手机iPhone。
版本不一样,价格也不一样。
谷歌这么做,才是成熟科技公司的做法。
因为你的产品,最终是要解决客户问题的,否则不会有持续性的市场。
03 尾声
其实,国内许多大厂的困境,跟谷歌是一样的。
它们也跟进了,但太心急了,年初就抢着推出了各种大模型。
虽然抢了时间,但口碑比较差。
反观谷歌,投入了足够的资源和时间,才不紧不慢丢出王炸,镇住全场。
这就叫,不鸣则已、一鸣惊人。
你急什么呢?知道你落后了,踏踏实实追就行了,真没必要赶鸭子上架、打肿脸充胖子。
这是我们需要深刻反省的问题。
风口来了,当然要追,但别乱追。
不然真成了炒股价的皮包公司了,对得起自己科技巨头的名声吗?(全文完)