GPT-4发布不到24小时,3月16日,国内互联网大厂百度就召开新闻发布会,推出了新一代知识增强大语言模型——文心一言。短短几天内,申请文心一言API调用服务测试的企业已突破6.5万。
百度发布文心一言,吹响了国内大模型应用的号角。人工智能擂台赛开场,国内生成式 AI 模型的发展情况如何?
文心一言对标ChatGPT
“洛阳纸贵是什么意思?”面对提问,被称为“中国版ChatGPT”的文心一言正确解释了成语“洛阳纸贵”的含义,还按照百度创始人、董事长兼首席执行官李彦宏的要求,在短时间内用“洛阳纸贵”作出了一首藏头诗。
3月16日,备受关注的百度文心一言终于揭开面纱。这款基于文心大模型技术打造的生成式对话产品和ChatGPT一样,同样具备在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的能力。
在生成式AI大模型的演进中,多模态已经成为业界公认的发展趋势和竞争焦点。GPT4也体现出这一能力——能够处理图片信息以及带有文本和照片的文档、图表或屏幕截图等图文交错的信息,并以文字的方式输出,但并没有体现出文字生成图片、语音甚至视频的能力。
百度的文心一言却具备这一能力。发布会上,文心一言应李彦宏的要求,为2023世界智能交通大会创作了一张海报,并用四川话讲述了“智能交通最适合哪个城市发展”,还将上述内容生成了一条视频。
虽然在此之前,复旦已抢发了类ChatGPT模型MOSS,小冰公司也内测了类ChatGPT应用“小冰链”,但客观来看,百度目前是全球大厂中第一个做出对标ChatGPT产品的企业。对于百度自身而言,上线“文心一言”,C端搜索生态的重塑机会和B端的赋能都会为其带来新的想象空间。
“没有想象中那么惊艳”
近日,各大生成式AI技术可谓再上新台阶。首先是ChatGPT升级。3月14日,OpenAI宣布推出大型语言模型的最新版本ChatGPT-4。在其内部评估中,ChatGPT-4产生正确回应的可能性比ChatGPT-3.5高40%,能在职业和学术各方面标准上达到人类水平。
生成式人工智能的表现虽然令人惊艳,但远未达到完美无缺的程度。在百度文心一言发布会,有人士表示“没有想象中那么惊艳”。因为采用的是PPT中视频演示而非实时演示,而被大家调侃成“ChatPPT”。李彦宏也坦言,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,这是百度接下来加紧训练、不断完善的方向之一。
文心一言、ChatGPT背后的技术逻辑,与通过海量无标注数据训练的大模型之间差异鲜明,即需要人的参与。整体而言,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也有bug出现,存在很大进步空间。即便是大受褒奖的GPT-4,在其公布的报告中也坦言,他们仍然无法彻底解决大语言模型的幻觉问题。相比ChatGPT,GPT-4回答事实性问题的准确率已达到80%,ChatGPT只有60%。
吹响国内大模型应用号角
ChatGPT爆火之后,海内外互联网大厂纷纷表示下海进行人工智能竞赛。百度是第一个发布产品的互联网大厂。百度发布文心一言,吹响了国内大模型应用的号角。国内的腾讯、字节跳动都明确表示,成立专门团队,训练大模型,开发自己的人工智能产品。上海交通大学计算机系助理研究员陈露透露,在类ChatGPT赛道上,中国已拥有许多不亚于文心一言规模的大语言模型,如浪潮的“源”、华为的盘古、阿里巴巴的PLUG,腾讯、字节等互联网大厂也有未公开的模型。
2月20日,复旦大学团队发布类ChatGPT模型MOSS,邀公众参与内测。当晚人们的体验热情就挤爆了服务器。目前MOSS的中文水平存在不足,团队称已经开始自己构造一些高质量的中文数据,目标是打造一个具有中国特色的中文大型语言模型。
产业智能化变革将开启
专家认为,ChatGPT未来有望演变成新一代操作系统平台和生态,并引发整个产业格局巨变,大模型及其软硬件支撑系统的生态之争,将成为未来十年信息产业的焦点。
业内认为,随着大模型技术能够和垂直行业深度融合,应用逐步落地,产业的智能化变革将开启。光大证券电子通信行业首席分析师刘凯、计算机行业首席分析师吴春旸指出,大模型是AI发展的基础设施,MaaS(Model as a Service)的商业模式应运而生,即有能力的大公司提供预训练模型,使得垂直行业的小公司能够构建和部署AI模型,而无需投资构建自己的模型需要的基础设施、硬件和专业知识。
百度也表示,文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。深度学习平台加大模型,贯通AI全产业链,夯实产业智能化基座,将进一步加速智能化升级。张丽娅 整理