当前位置:首页|资讯|文心一言|百度|人工智能

文心一言来了:超级生产力工具上线!

作者:Tech星球发布时间:2023-03-17

原标题:文心一言来了:超级生产力工具上线!

来源 | Tech星球

| 王琳

百度生成式AI产品“文心一言”今天交卷了。

就在下午举行的新闻发布会上,李彦宏在现场展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

对比下来,在大模型通用的优势能力上,比如文学创作能力、商业文案写作能力、数理逻辑推算能力上,文心一言已经逐渐接近人类水平。甚至得益于百度这个最大的中文搜索平台,文心一言具备出色的中文理解能力。这是目前全球任何生成类AI产品都无法比拟的。

比如当你询问文心一言,明日黄花与昨日黄花有什么区别。它可以明确给出回复:

而将同样的问题抛给ChatGPT,它显然无法理解题意:

比如,当你询问文心一言,关羽和秦琼谁更厉害时,文心一言可以从战绩、战略、战术多个角度分析:

而当同样的问题抛给ChatGPT,它似乎无法做出更精细的评价:

虽然,文心一言现在也并不完美,李彦宏提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。

但用户的热情不减。新闻发布会后三小时内,排队申请文心一言企业版API调用服务测试的企业用户已达6.5万家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

任何技术创新的发生一开始都不是尽善尽美的,而是慢慢迭代才得以完善。放在更长的视角来看,每一次工业革命无不是先进的生产力取代落后的生产力,将人类从重复繁杂的低端劳动中解放出来,而这些现在看起来先进的生产力,在诞生之初多多少少都存在问题。

作为第四次工业革命一个现象级的产品,文心一言可以让每一个人,每一家公司有机会享受技术带来的红利。大模型基础设施公司、进行行业模型精调的企业、基于大模型底座进行应用开发的公司都可以将其视为一个API,连接到应用程序,改变一个又一个行业。

过去10年,百度一直希望把技术变成人人需要的产品,文心一言的出现让这种希望成为了现实,每个人都可以利用这样先进的生产力工具,为自己服务,为企业服务。

不夸张的说,文心一言是百度技术人员追逐技术改变世界的梦想的产物,是百度过去10年压强式、马拉松一样的投入的成果,也是反馈驱动创新的最佳实践。

全球大厂第一个生成式AI产品

全球大厂,谁将第一个推出第一个类ChatGPT产品成为了科技圈、创投圈乃至普通用户都最关注的事情。

在2月8日举办的Google Event大会,谷歌率先展示了旗下类ChatGPT产品Bard,不过出了乌龙,Bard答错题了。谷歌颜面尽失,灰头土脸得撤下了YouTube相关演示视频。随后,谷歌没宣布发布日期,ChatGPT比想象的要难,谷歌并没有准备好。

就在Google Event大会前一天,百度宣布其计划在今年3月推出与OpenAI的ChatGPT类似的人工智能聊天机器人服务,该项目名字确定为文心一言,英文名ERNIE Bot,三月份完成内测,面向公众开放。随后,阿里、腾讯、华为都宣布入局,但他们和谷歌一样,并未公布产品发布的时间。

百度这次没有吹牛。今天下午文心一言启动产品测评,虽然对标ChatGPT难度很高,但百度依然是全球大厂中第一个做出类似产品的。

现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

大模型在回答文学创作领域的事实性问题经常犯的一个错误就是胡编乱造,或者说张冠李戴,Bard当时就是犯了这样一个错误。

总结、分析、检索内容对文心一言来说不在话下,在今天下午的产品测评中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度。

文心一言还具备推理能力,比如当问到,“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也可以得出了正确答案。

这是因为, 基于搜索业务积累,百度有世界上最大的知识图谱,一直致力于给用户提供唯一答案。这一切让文心一言回答准确性及生成结果的可信度得到提升。

在商业文案创作上,文心一言还可以带给你惊喜。当要求他给一个“用大模型服务中小企业数字化升级的科技服务公司”起名字时,它起完名字后,还会解释这个名字的意思。比如起名智信科技,是结合了智能和信任的意思,体现了公司致力于中小企业提供智能化、可信赖的数字化服务。

系统并没有教给文心一言这样的能力,但是有研究表明,当数据规模大到参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。因此,发生“智能涌现”,带给用户一些小惊喜并不意外。

当然,具备一定思维能力的文心一言在“鸡兔同笼”这样的数学题时也表现出色,最值得一提的是文心一言在中文理解和多模态上的表现。

在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

李彦宏表示,文心一言可以处理英文,但它的表现还没有那么好。原因是数据注入没有那么多,未来百度会持续加强投入,包括其他语种。

现在,信息流通的方式已经远远不止文字,而是包含图片、视频、音频在内的多模态形式,文心一言可以帮助用户做海报宣传图、宣传视频,甚至可以用方言,如四川话、东北话来回答用户的问题。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

十年蓄力,最全的技术储备

百度能够成为全球大厂第一个推出类ChatGPT产品不是偶然。

从外部来看,过去一个月,超过600家合作伙伴宣布加入文心一言生态,期待尽早用上最新最先进的大语言模型。而百度内部的很多产品,从搜索到智能云,再到自动驾驶,市场和合作伙伴都有明确需要。

但更重要的是内因。

自然语言处理是人工智能领域的明珠,也是要解决的核心问题之一。2010年,王海峰博士加入百度成立了“自然语言处理部”,这也拉开了百度押注人工智能的序幕。

百度扎根AI这些年,人类已经从信息时代逐渐进入到人工智能时代,IT技术的技术栈发生了根本性的变化,过去分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。

百度是全球为数不多进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,搜索、自动驾驶等AI产品,每一层百度都有具有领先优势。

外界不太熟悉的是,在成立自然语言处理部后,百度也于2011年开启了其自研芯片之路,是国内第一批自研 AI 芯片的互联网公司。等到2018年,昆仑芯片对外发布时,已经支持了百度业务多年。现在,已经有超过2万片昆仑芯片得以落地应用。

2018 年7 月,李彦宏在百度 AI 开发者大会上喊出了要让“EveryoneCan AI”的口号,飞浆就是这一口号的实践者之一。2021年,飞浆超过了国外两个老牌深度学习框架TensorFlow和PyTorch,成为中国开发者使用最多的深度学习框架,在全球排名第三。

AI竞速本质上就是算法、算力、算据的竞争,而飞浆和昆仑芯片让百度集齐了这三大要素,正是基于此,飞浆推出3年后,百度便推出了文心大模型ERNIE 1.0,这就是去年开始大热至今的“生成式AI”技术。目前文心大模型已经迭代到第三代,ERNIE 3.0目前每天接受数十亿用户的搜索请求和其他百度移动生态app的训练,这让模型得以更精准。

全栈布局的好处是四层架构之间,可以实现端到端优化,大幅提升效率。尤其是框架层和模型层之间,有很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

过去10年,AI有过很多争议时刻,投资人们觉得短时间内无法落地。投入Ai需要强大的战略定力,毕竟短期内它不能产生强大的现金流而长期来看商业价值巨大。

作为一家上市公司,百度需要权衡股东利益,但更需要找到可以坚持十年,二十年,甚至上百年的事情。百度没有只看眼前利益,而是找到了更具挑战性的事业。公司坚持在技术上压强式投入,近十年累计研发投入超过 1000 亿元。

刚刚过去的2022年百度核心研发费用达到214.16亿元,占百度核心收入比例达22.4%。如此高的研发投入,在大厂中凤毛麟角。要知道,去年前三季度,阿里、腾讯、美团的研发投入占比分别约为15%、10%和8%。

高研发投入也让百度储备先发优势,面对大模型惊人的算力需求做到游刃有余。

数据显示,跑通一次100亿以上参数量的模型,算力至少需要1000张GPU卡。GPU芯片中领先者如A100售价达1万美元, 微软Azure云服务为ChatGPT布署了超过1万枚英伟达A100 芯片。

即使不使用顶级芯片,按照一张GPU五万元的市场均价计算,1000张GPU意味着单月至少5000万的成本。业界测算,gpt-3单次训练成本至少460万元。

文心一言有万亿级参数,可想而知,其光GPU成本就已经耗费了可能10亿。这样来看,文心一言只是百度在AI技术上投入的一个自然结果。

人人可用,最先进的生产力工具

文心一言现在显然无法完美回答用户的所有问题,在前端体验上依然有些不足,事实上就连ChatGPT在其所擅长的文本交互一开始也不能做到战无不胜。

但我们不能因为一些缺陷就否定它的价值,无论是ChatGPT还是文心一言,应该看到未来的发展潜力和可能性。

文心一言和ChaGPT所采用的技术都是一样的,比如用于训练阶段的模型微调SFT, Supervised fine-tuning)、基于人类反馈的强化学习RLHF(reinforcement learning from human feedback)、给预训练大语言模型做提示的Prompt都没有差别。

我们看到了文心一言的不足,也必须承认文心一言在某些方面威力强大,比如文心一言不仅可以处理文字,还可以识别图片、视频和音频。而这种多模态语言,才是未来发展的趋势。

文心一言的定位是人工智能基座型的赋能平台,你可以将其视为一个API,连接到应用程序,借助这个最先进的生产力工具,人们有望改变千行百业。

比如,大模型基础设施公司通过云计算输出能力和服务,文心一言,将根本性地改变云计算行业的游戏规则。进行行业模型精调的公司,可以借助文心一言为行业客户提供更精准的解决方案。基于大模型底座进行应用开发的公司,可以像当初人们在安卓系统上开发出App一样开发出一个个极具潜力的应用。

最重要的是,普通人也可以用它来解决工作上的一些问题,比如写营销方案,写论文等等。确切得说,文心一言是一个人人可用的生产力工具。

中信建投《人工智能行业专题报告:从CHATGPT到生成式AI(Generative AI)-人工智能新范式,重新定义生产力》指出,生成式AI和此前的决策式AI模型最大的不同是,前者是根据已有数据分析、判断、预测,而后者更强调学习归纳后进行演绎创造、生成全新的内容,本质上是对生产力的大幅度提升和改造。

不过最终,一个生产力工具是否好用依然需要人类的训练加持。

这和大模型通过海量无标注数据训练是不同的,需要每一位用户的真实反馈,这些真实的用户数据会融入到训练中,持续提升效果。最终,打造出符合人类使用习惯的大语言模型。

任何一项先进工具的发明在诞生之初都不是完美的,200多年前,纽科门大气式蒸汽机诞生,但效率低下。多年后,瓦特推出的改良版蒸汽机将效率提高了3倍,人类得以更快进入工业社会。

100多年前,德国发明家奥托制造了世界上第一台内燃机,但其对燃料要求高,无法大规模应用,后来燃料从煤气变成了汽油,热效率也从4.5%一步步突破30%,火车、汽车借此出现,人类的出行半径得以迅速扩展。

作为生成式AI最典型的产品文心一言无疑是AI时代最先进的生产力工具,但这个工具依然不够好用。不过,历史已经告诉我们,随着人类使用、优化,每一个工具都会越来越符合人类使用习惯。到了那时候,百度技术人员追逐技术改变世界的梦想又进了一步。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1