百度“文心一言”,欲打造中国版的ChatGPT
OpenAI前脚刚发布ChatGPT语言模型(GPT-3.5)的进阶版本GPT-4,百度后脚便发布了中国首个生成式AI 语言大模型“文心一言”,并展示了其在多模态、大语言模型方面的突出表现。
不同于ChatGPT上一个版本仅能处理文本信息,此次GPT-4和文心一言均选择了多模态作为其主要演示点。
较为遗憾的是,GPT-4仅演示了其在图片识别及代码生成网页方面的进化,对于视频、图片生成等方面,暂未看到其潜力;
而文心一言则展现的更为全面,除了对文本、图像的处理和反馈,还有视频的AI式生成(这点,其实我们早在百家号图文转视频的功能里,便看到了其大规模应用)。
而更令人惊喜的则是其在文学创作、商业文案创作、数理推算、中文理解等维度的表现,不禁让人有种强人工智能(一种类似于人类级别的人工智能,在各方面都能和人类比肩,人类能干的脑力活它都能干)时代已经来临的恍惚感。
两场发布会仅相隔一天,因此不可能说谁抄谁,而只能说双方都想到了一起,对生成式AI的未来达成了基本共识,即多模态一定会是未来的演进方向。
自上一代基于GPT-3.5的ChatGPT惊艳亮相以来,关于生成式AI的讨论便此起彼伏。普通人害怕AI的强大,而商业界却狂欢于新风口的到来。看到ChatGPT的威胁,高调宣布加速布局的企业也不在少数。其中,谷歌快马加鞭,短短几个月便迎头赶上,推出类ChatGPT产品,但从实际反馈看,体验效果似乎并不乐观。国内方面,百度可谓一马当先,率先发布了自有生成式AI大语言模式“文心一言”,而这也无可置疑地成为了近期全民关注的焦点。
从近几天舆论看,其讨论热度委实不低。而资本层面也给出了积极反馈,截至3月18日收盘,百度港股及美股全线飘红,百度终于一扫发布会后短暂下跌的颓势,为自己的技术优势正了名。
然而,鉴于发布会是录播而非直播,且之后百度并未宣布全面开放,而是针对部分用户和企业用户开放API接口,这不免引起人们对百度“文心一言”真实水平的质疑,吐槽百度“PPT发布会”“画大饼”的不在少数。而从部分媒体对比测试文心一言和GPT-4的结果来看,“文心一言”输多胜少的表现,似乎确实有点打脸百度。
不过在我看来,目前“文心一言”逊色于GPT-4是很正常的。
要知道,GPT-3.5的参数量是1750亿,而GPT-4只会更高;
从训练成本看,训练一次GPT-3.5的成本,需要460万到500万美元,而训练一次GPT-4的成本恐怕不会少于500万美元;
从硬件成本看,更早的GPT-3,需要用到1万枚英伟达GPU芯片,以英伟达A100芯片为例,单颗价格约1万美元,1万枚就是1亿美元;后来的GPT-3.5、GPT-4硬件成本只会更贵,而这还不算数据中心以及人力方面20多亿的成本。
如此看来,生成式AI是多么烧钱的一项技术,真不是谁都可以玩的。百度再有钱,恐怕也不可能全部押注,何况训练也需要时间,百度虽然有基础,但并不具备一夜赶超的实力。
发布会上,李彦宏也坦言:“大家的期望值,是我们对标ChatGPT,对标GPT-4,这个门槛有点高。”
微软已经陆续向ChatGPT的开发者OpenAI投资了近900亿人民币,而这些钱目前才刚刚看到商业化的苗头。不过短期看,想要大规模商用还需假以时日,微软要想拿回自己的投资回报还需要漫长的时间。
而百度方面,商业化似乎走得更靠前一些。今年2月份,百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
而近期,我们也看到不少车企搭载文心一言的相关宣传,比如发布会当天,长安汽车旗下的逸达,宣布成为国内首款搭载“文心一言”的量产车型。
产品未完善,商业化先行,由此可以看出百度的超前思考和布局:一方面,证明百度具备强大的技术实力和品牌感召力;另一方面,通过企业合作,也可以为“文心一言”训练提供强大的多元化数据支撑,进一步提升其迭代水平,更好展现自身更智能、更人性、更懂你的商业价值。
结语
对比来看,文心一言将比ChatGPT具备更强的本土化优势,其应用场景也会更多元,垂直度和准确度也会更高,这是百度被资本市场看好的重要原因所在。
从全球范围看,生成式AI大模型,必将成为科技发展又一个兵家必争之地。原因不仅在于其优越性和广泛性,更在于其所具备的前瞻性和思想性——当然,说思想性可能为时尚早,不过从文心一言和ChatGPT对创作和数据推理的水平看,生成式AI大模型显然已经超出了一般意义上的机器智能。
近期,微软宣布将GPT-4整合进Office全家桶,并且演示了其在办公软件中的强大应用之后,更多人表示不淡定了:这次,打工人可能真的要被AI取代了!