当前位置:首页|资讯|阿里巴巴|百度|华为|腾讯|商汤

古典互联网创业者的“第二春”:让大模型先跑一会儿

作者:商业与生活发布时间:2023-04-21

原标题:古典互联网创业者的“第二春”:让大模型先跑一会儿

©商业与生活 文|朱晓培

校对|大道格

“今天真正是一个在技术领域,对未来10年、20年形成重大历史契机的关头。”

4月11日,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇现身2023阿里云峰会现场。这是他躬身入局进入到云的战场后的第一次公开演讲,也是疫情开放以来的中国互联网的第一此大型活动。

活动现场摩肩接踵,主论坛坐满了,直播间坐满,工作间也满了,挤不进去的人们就围在走廊的大屏前观看直播。而同样热闹的现象,也出现在了一周之后的火山引擎的原动力大会现场。

人们风尘仆仆的从四面八方赶到现场,都在关心同样的问题:如何重回增长?如何看待正如火如荼的人工智能(AI)浪潮?

过去两个多月,因为ChatGPT的走红,中国互联网科技领域一改近两年沉闷的氛围。从已经久居幕后的互联网连续创业者,到互联网大厂,各个摩拳擦掌,都期望在AI浪潮中寻得一席之地。

看起来,以大模型技术为代表,新技术带来的效率革新就在眼前。在这样一个风云变幻大时代场景下,所有的人都热切的想知道,这个AI浪潮,对中国的经济,乃至对中国科技的未会带来什么?

01

大模型大爆发

自2月10日,王慧文发布自己的AI宣言以来,在中国创投界一向雷声大、雨点小的AI领域,突然如老房子着火,一发不可收拾。

据不完全统计,仅过去一个月内,国内已经或者即将内测的大模型就有百度文心一言、阿里通义千问、华为盘古、腾讯混元、昆仑万维天工、商汤日日新SenseNova、AI创业公司Minimax、360大语言模型、出门问问序列猴子等等。此外,火山引擎发布了大模型训练云平台。小米雷军也按耐不住在微博上表示,对于大模型,将“全力以赴,坚决拥抱,正在研发一些有趣的技术和产品”。

这轮由ChatGPT引爆的技术热潮,经过了三个多月的发酵,就在国内迎来了第一轮爆发。密集的发布会,让从业多年的老媒体人也感慨,职业生涯少见。

出门问问CEO李志飞说,自己在去年12月就开始了大模型的开发,总觉得自己应该是国内第一个发布大模型的,但没想到百度的文心一言、阿里的通义千问等都抢在了前面。

随着互联网大厂纷纷躬身入局,形式似乎也越来越明朗——ChatGPT 开启了通用人工智能(AGI)时代,而大模型是目前看来通往 AGI 最靠谱的实现方式。

“ChatGPT 给了我非常强的震撼,它特别有意思的是,无论你如何‘调戏’,它都能给你答案。”李志飞说,之前,他对AI大模型持怀疑态度,想不通可以用来做什么;但GPT-3 发布后,他觉得AI什么都可以做了。

“人工智能技术全面的爆发,和新一代技术的出现,和可能带来的对各行各业颠覆性的影响,和时代的机会,让我们看到了一个全新的数字化时代后智能化时代的到来。”阿里张勇认为,所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。“这一定能带来不仅是一种创新性的客户体验、客户服务满足,同时也会让我们的生产范式、工作范式、生活范式发生很多变化。”钉钉总裁叶军也率先表示,“用大模型重做一遍钉钉,我们的决心是非常大的。

李志飞也持相似的态度,“AGI一定会对这个时代产生重要影响,未来五年,我看不到任何一个行业不会被大模型影响。无论是什么行业,包括物流、供应链、硬件等各种看起来和大模型没有直接关系的行业,都将受到影响”。

02

古典互联网创业者重新扎堆

“因为GPT,一批古典互联网创业者又重新扎堆了。”一位资深媒体人、创业者在加入了一个AI创业群后,发现群里大部分人都是老朋友——都是一些连续创业者,有人还做过一两家上市公司,但前两年又处于退休的状态,比如王慧文、王小川。

既然连张勇都认为,在大模型面前,大家都在同一起跑线上,那么古典互联网创业者的激动,也就在情理之中。

弗洛伊德曾提出过一个名词——“穷人精神官能症”,指经济快速发展的过程中,除了少数几个“赢家”外,还有一群人(仍是少数)虽然经济状况已经在普通人之上,但却对现状既不满意,一遍觉得自己赚得还不够,另一边有喜欢对外说自己对钱没兴趣。这种“症状”其实同样适用于创投领域,特别是小有成绩的创业者,更渴望巨大的成功。

“你遇到超越工业革命的这么一件事儿,肯定会去思考,要做点什么?”正如宝宝树创始人王怀南所说。他对《商业与生活》表示,无论是宝宝树这一端,还是在银发事业这一端,大模型的出现,让自己都有巨大的机会可以革自己的命。眼下,他也正在筹备自己相关的创业项目。

但最激动、最积极的,莫过于搜狗公司创始人王小川。虽然他比王慧文晚了两个月才宣布进入大模型领域创业,但一入场就接二连三的接受了多家媒体的采访。

据王小川自己爆料,他新创办的百川智能,以前搜狗团队为基础,还拉拢了百度、华为、微软、字节、腾讯等知公司以及其他创业公司核心成员在内的数十位顶尖AI人才。而公司目标,也在王慧文“组建中国版OpenAI”的基础上,又增加了“打造颠覆性上层应用”。

王小川在接受媒体采访难掩兴奋,他说,“通用人工智能时代刚刚开启,我们作为第一批跨入新时代的人类,带着焦虑和好奇去拥抱它,思考和探索‘我是谁?’我们还可以把自己的智慧注入它,做新时代的开创者,让后代们有一个更美好的未来,繁荣和延续人类文明。”

不过,他可能忘了,一年半前,他曾在宣布卸任搜狗CEO的内部邮件里宣布,往后二十年,要在生命科学和医学领域再出发,为大众健康做贡献。毕竟,大健康这个领域的风口,随着疫情的结束已经落了下去。

当然,连续创业者成为为大模型摇旗呐喊的主力,还有一个原因,大模型烧钱。根据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为140万美元,对于一些更大的 LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。李志飞也表示,“目前ChatGPT训练一次的成本就高达1千万美元,‘算力’也就是芯片的开销,就是一笔巨额成本。”

此前,王慧文豪抛出5000万美元招募大模型人才时,还被外海通证券研究所科技产业链负责人郑宏达质疑“5000万美元够干什么的?”因此,这也不是像以往的电商、社交甚至O2O项目那样,是普通打工人就可以想的事情。 但对于那些手握大量现金,又处于隐退状态的连续创业者而言,这确实一个难得的好机会。

王慧文说,自己本来想搞个基金,去投最前沿的科研。因为前沿科技的投资,打水漂的比例很高,名字都想到好了,就叫傻瓜资本。但是,还有句话说,投资别人,不如投自己。

03

做大还是做小

从技术的角度来看,大模型发端于自然语言处理领域,以谷歌的BERT、OpenAI 的GPT 为代表。这两个大模型越跑越大,目前参数规模逐步提升至万亿,随着用于训练的数据量级也显著提升,模型能力的提高。

但其高深莫测的AI能力,也引发了业界的担忧。

此前,包括马斯克、图灵奖得主Yoshua Bengio、苹果联合创始人Steve Wozniak等多位科技界知名人物签署了一封公开信,呼吁在6个月内暂停开发比OpenAI公司新推出的GPT-4更为强大的系统。

公开信被曝光后,引发了更多的人开始关注、反思AI背后的安全性问题。目前,欧洲多个国家已经掀起了对ChatGPT的监管行动。而ChatGPT也从人工智能的宠儿,开始变成需要“锁在笼子里的巨兽”。

身处风暴中的OpenAI公司CEO山姆·阿尔特曼(Sam Altman),在近日的麻省理工学院的公开活动上,对公开信做出回应称:“我非常同意其中的部分内容。我们完成对GPT-4的训练后,花了6个多月的时间,研究大模型的安全性……我也同意,随着AI能力变得越来越强大,安全标准必须提高。”“现在并未训练GPT-5,在短期内也不会训练。”

与OpenAI一开的策略不同,国内大模型普遍选择从B端起步。从目前的信息可以看到,企业都在思索如何将已有的大模型规模 “做小”,以更小的参数,做更有效率、更适合垂类的场景。

比如,华为盘古大模型,就将重点发展细分场景的落地为煤矿、水泥、电力、金融、农业等。

阿里通义千问目前也已改造阿里生态内的产品为主。而百度对文心一言的定位也同样偏向B端,主打为金融、能源、媒体、政务、医疗等行业赋能。

把大模型做“小”,有几个好处。

首先,技术上,GPT-4已经接近了LLM(大语言模型)的极限。山姆·阿尔特曼说,“我认为,我们已经走到了这个时代的尽头,我们将以其他方式把这些大模型做得更好。”“如果可以的话,参数数量应该随着时间的推移而减少,或者我们应该让多个模型一起工作,每个模型都更小。我们希望向世界提供的是最强大、最实用、最安全的模型。”

其次,是省钱。众所周知,大模型参数越大,训练花费越高。使用的人越多,耗费的算力越高。在商业化模式还不明朗、开源节流仍是时代主题的当下,一昧的做大,让大模型成为人们“调戏”的对象,在商业和技术上并没有太大的意义。

04

挖矿或者卖铲子

当别人都去挖金矿的时候,稳赚不赔的一定是卖铲子的人。要做大模型,则离不开算力这个“铲子”。

根据国盛证券的报告,以 ChatGPT 在1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。如果将当前的ChatGPT部署到谷歌进行的每次搜索中,需要512820.51台A100 HGX服务器和总共4102568个A100 GPU,这些服务器和网络的总成本仅资本支出就超过1000亿美元。

大模型训练非一日之功,想要入局大模型,拥有大算力是必备条件之一。市场上流传的调研纪要显示,要训练像ChatGPT这样的生成式AI,至少需要1万张英伟达A100加速卡的支持。目前,国内只有6家公司具备这样的硬件实力。更不要提后续,随着模型扩张、场景落地,算力需求还会进一步增加。

换个角度而言,不论大模型未来走向何方,“算力”都将会是受益的那方。因此,腾讯、阿里以及字节,这些本身就拥有云服务的企业,一边加自研大模型,一边开始抢夺算力市场。

4月14日,腾讯云发布了面向包括自动驾驶训练、自然语言处理、AIGC大模型训练等大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群。

火山引擎总裁谭待则表示,火山引擎将全面基于DPU构造大规模算力中心,形成DPU+CPU+GPU的混合算力体系。并强调,“除了自研能力带来的极致性能以外,通过规模化优势为客户带来更多“实惠”也是火山引擎一直努力的方向。“

“(阿里云对)智能化时代的到来已经准备好。”张勇说,云计算、人工智能爆发的发展,首先需要一个几何级速增加的算力支撑。而阿里云经过这么多年的建设形成了全栈的技术服务,未来工作的一个重要方向就是“算力普惠”。

张勇让阿里云的同事把过去10年云计算服务最重要的两个价格,发现算力服务降了80%,存储服务降幅则接近90%。但未来,他希望中间算力的成本能达到今天的1/10,乃至1/100。

巨头大力布局算力市场,看起来也是一个双赢的局面。

具体来说AGI需要靠给用户提供有价值的服务来商业化,并且利用用户对服务的反馈来持续的提升,我们坚持做AGI原生应用,这些应用本身就是“User--in-the-Loop”的系统。过去的几个月里,这个系统平均每天与用户产生近亿次的互动,并在互动中持续提供更好的服务体验。

“对于一家创业公司来说,我们无法在一开始就拥有大量的算力,但是我们非常幸运的发现,中国的公有云市场已经积累了,大量的算力和经过验证的基础设施。”MiniMax联合创始人杨斌说。MiniMax是依托火山引擎机器学习平台,研发的超大规模的大模型训练平台。

杨斌感慨,一年多前,作为一家AGI初创公司说要研发大模型,几乎是天方夜谭。但今天,随着GPT热潮涌动,技术如何启动,产品怎么做,算力从哪里来?这三个问题都不再是大问题了。

05

谁是中国的OpenAI?不重要!

目前,业内普遍认为,国内的大模型与OpenAI仍有差距。

李彦宏说,“如果全面来评测的话,文心一言确实也不如现在最好的 ChatGPT 版本,但是差距不是很大。所谓不是很大,可能就是一两个月的差别。”

王小川在接受媒体采访时则表示,差距极大,在生成式人工智能领域美国“比我们领先3年时间是有的”。

李志飞则给了一个折中的数据,“国内模型水平大概处于FLAN阶段,比GPT4晚16个月。”

因为,差距到底有多大,王小川与百度还暗戳戳的互怼了起来。而互怼的背后,则是都想宣称自己是中国的OpenAI。

王小川在接受媒体采访时说,年底要做出国内最好的大模型,对标GPT-3.5的大模型。但百度集团副总裁、搜索平台负责人肖阳暗示:王小川脱离一线太久,对国内人工智能技术的发展缺乏了解。“我们当然非常希望中国如果能够跑出一家像OpenAI一样的公司。但是怎么说呢,当年搜狗也立志取代百度,结果也是显而易见。”

但实际上,现在谁是中国的OpenAI这件事,正在变得不重要。就像张勇所说的,“不管谁做了大模型,不管谁做了什么样的模型,不管谁做了专属模型,今天我们畅想未来,10年以后、20年以后回过头来看这段时间,其实我们所有的企业都在同一个起跑线上。”

而且,随着越来越多的公司发布自己的大模型,并找到相应的行业切入。越来越多的业内人士开相信,未来将会是多种模型共存的局面。阿里也表示,通义千问是为用户提供了更多一种的选择,“我们也希望在阿里云的平台,在云的基础设施平台上,不仅有阿里的通义大模型,同时也有跟高校、科研院所、各行各业合作的基础大模型。”

“就像多云是既成事实一样,多模型也一定会是未来趋势,多云多模型是长期的IT格局。”火山引擎谭待说。

即使是最先提出要做中国的OpenAI的王慧文,再键入AGI领域两个月后,也有了不一样的认知。“这个事情还是有非常多要探索的东西。不到最后一天,AGI这个事情谁做成还不好说,你凭什么认为一定是OpenAI先于我们做成?它们只是现在领先而已。”

06

让大模型再跑一会儿

回看王慧文2月的AI宣言,就像在干草堆里点了一把火,让中过的互联网公司热闹了起来。这里面,固然有蹭热度、赶潮流的,但对于云计算来说,其实也是厚积薄发、水到渠成的结果。

尽管有一些人质疑GPT又会是一场技术泡沫。比如吴军就撰文称,ChatGPT被过度的炒作了,“不算新技术革命,带不来什么新机会 ”

但是,技术泡沫也有泡沫的好处。财经作家迈克尔·刘易斯在《为经济繁荣辩护》一文中提到一个观点:每一次技术泡沫,都会让社会受益。

无论你对繁荣有什么看法,不可否认的是,它会让人们不停地忙碌。资金会以工资的形式流向社会,更多的年轻人会因此受到技术训练,并拥有了创业欲望;企业家会产生更多有趣的商业想法,这些想法或许看起来是超前的,但说不定有一天就与时代保持一致了。哪怕竞争看起来是一地鸡毛,就像第一次互联网泡沫破后数百万英里长的冗余光纤,当时看起来有点儿浪费,但今天又在人们生活中扮演着重要的角色。

我问王慧文,“各种大模型的密集的出货速度,有没有出乎你的意料?”他答道,“还好吧。”

不同于之前做美团,看谁都是对手,忍不住想刻薄两句。王慧文说,看AI领域的从业者,勇于踏上这条路的人都是勇士,需要的是同舟共济。而张勇也说,如何抓住未来的机会,是大家共同的愿望,也需要一些共同的合作和努力。

更何况,科学技术的发展,不是积累式的线性的,而是跳跃式的,一经突破将迅速展开,就会另辟蹊径进入一个新的世界。因此,不妨让大模型先跑一会儿。

—End—

推荐阅读

蛰伏三年,王慧文为何为OpenAI心动?

颠覆性创新年代,手机企业靠什么穿越周期?

阿里巴巴:一家好公司必须具备的三个品格

拼多多:为何热衷于讲农业的故事?

66.8万吨,二手为什么拯救世界?

重估平台价值,关键要素仍然是“人”

风起循环电商,红布林做对了什么

“两乐”加码无糖饮料,元气森林守得住吗?

消费券里的“新趋势”:即时零售加速跑

“数实融合”,中国互联网必须走出舒适区

e代驾十年启示:跑得快不如走得远

小镇青年正在用淘特打开新的生活方式

更多关注:商业与生活,ID:xiaopeizhu8

内容同步:网易号、同花顺、百家号、今日头条、UC、雪球、企鹅号、一点资讯、知乎、搜狐等。

联系微信:hongzeng629


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1