一阙《青玉案·元夕》,辛弃疾用时间制造了顺理成章的浪漫。 八百多年后,由词化名的科技公司百度,用大语言模型开启了“生成式AI”时代。通过文心一言,“众里寻他”只需要几秒钟的时间。
3月16日,百度召开新闻发布会。从百度创始人、董事长兼首席执行官李彦宏现场演示的demo效果上看,文心一言具备文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力,还在中文理解、多模态生成能力上更具特色。
不过,文心一言、ChatGPT背后的技术逻辑,与通过海量无标注数据训练的大模型之间差异鲜明,即需要人的参与。整体而言,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也有bug出现,存在很大进步空间。
人类向往科技,是期待它更好地理解人类意图,生成符合人类价值观、表达习惯的回复。这一点上,唯有真实的体验才能带给用户惊喜。从技术发展趋势上,大语言模型和生成式AI成为新的技术范式已毋庸置疑, 百度方面透露,已有超650家合作伙伴宣布加入生态,如李彦宏所说,AI的长期价值,对千行百业的颠覆性改变,才刚刚开始。
“十年分娩,一朝怀胎”
今起开放首批测试
ChatGPT出现后,一向走在创新路上的百度立刻官宣了对标产品文心一言。看似突然,但李彦宏介绍,百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发布了,此后每一年都要发布一个新的版本。
最新的版本在新闻发布会现场亮相,李彦宏与文心一言在5个场景展开了问答互动。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。面对《三体》电视剧演员于和伟和张鲁一“有哪些共同点”“谁更高”这类问题,文心一言也基于推理能力得出了准确答案。
除了文学创作,商业文案也是用户使用较为广泛的场景。在这一创作场景中,李彦宏对文心一言下达了“如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起个什么公司名”“数智云图这个名称不错,给我起一个公司的服务Slogan,表达共赢的概念”“帮我生成一篇公司成立的新闻稿,数智云图以共赢的服务理念用大模型服务中小企业数字化升级,字数600字”等指令。
搜索业务的基因是文心一言的基石。
李彦宏介绍,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱,是数据规模发生的“智能涌现”。而在百度搜索中,问答和生成类的搜索请求占比极高,因此文心一言在自然语言问答和创意内容的生成上有相对突出的表现。
值得关注的是,过去的几个月,让AI自行展开创作,“一本正经地胡说八道”是用户最头疼的问题。在这方面,文心一言表现如何?根据李彦宏的介绍,为减少错误率,百度对文心一言做了知识增强和检索增强,大幅度提升了事实性问题的准确率。
此外,李彦宏介绍,文心一言具备一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
不过,李彦宏也直言,现阶段文心一言的准确率还不是100%,需要更多的时间学习和成长。
发布产品细则的同时, 百度也公布了文心一言的邀请测试方案:3月16日起首批用户即可通过邀请测试码,在文心一言官网尝鲜。企业方面,百度智能云企业客户也可开始预约申请加入文心一言云服务测试。
根植本土文化
支持多模态拓展
文学创作、商业文案写作、数理逻辑推算是大语言模型相对常见的优势和能力。被李彦宏称为“十年分娩,一朝怀胎”的文心一言,还有哪些特殊之处?
首先,作为扎根于中国市场的大语言模型,文心一言具备中文领域极先进的自然语言处理能力,在中文语言和中国文化上有较好的表现。
为展示文心一言的中文表达能力,李彦宏现场就“洛阳纸贵”的典故输入了以下问题:洛阳纸贵是什么意思?当时洛阳的纸到底有多贵?这个成语在现在的经济学原理里,对应的理论是什么?用洛阳纸贵四个字写一首藏头诗。
文心一言所作藏头诗如下:“洛阳城里春光好,阳艳无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央。”秀了一波中文优势后,李彦宏也直截了当地表示,目前文心一言对英文语种、代码场景的训练还不够多,表现还不够好,未来会加紧训练,完善上述能力。
值得一提的是,对于生成式AI,用户还有一个期待,即多模态生成。 李彦宏也强调,多模态是生成式AI一个明确的发展趋势。
从现场展示来看, 文心一言具备生成文本、图片、音频和视频的能力。
有趣的是,文心一言还能生成四川话等方言语音。据李彦宏透露,每日有几万篇文章正通过该能力转成视频内容并在百度分发。不过,受成本限制,现阶段视频生成功能还未对全部用户开放。在李彦宏的设想里,通过定向微调,文心一言将在百度内外部各类产品上逐步展示出亲和力,拉近产品和用户的距离。
回应市场需求
在反馈中迭代进步
从宣布存在到此次上线,百度用了一个月时间。
最近一段时间,李彦宏接到最多的提问是:“你们真的ready了吗?”对此,李彦宏直言:“也不能说完全ready了,毕竟文心一言对标的是ChatGPT甚至是CGT-4,门槛还是很高的。无论哪家公司,都不可能靠突击几个月就做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
截至目前,尽管官宣推进此类产品的企业不少,但在国内,百度是第一个“吃螃蟹的人”。从内在因素上看,文心一言是百度过去多年努力成果的延续。自从进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层到“芯片-框架-模型-应用”四层,百度是为数不多、在四层进行全栈布局的人工智能公司。
而文心一言,就是百度在ERNIE及PLATO系列模型的基础上所研发,其关键技术包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。其中前三项为大语言模型普遍采用技术,后三项则是百度已有技术优势的再创新。
万众瞩目下交出成品,百度也没有避讳问题。在应对媒体采访时,李彦宏多次提到,自己在测试的过程中感觉到,(文心一言)还有很多不完美的地方。选择在此时推出,是因为市场有庞大的需求。
“百度的很多产品,从搜索到智能云、自动驾驶,再到小度,都是在市场需求下诞生的。从我们承认文心一言的存在到今日上线,一个月的时间里已有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上先进的大语言模型。”
在李彦宏看来,上线意味着大量的用户反馈,将加速文心一言的迭代速度,通过真实、及时的反馈倒逼大模型、深度学习框架和芯片的优化,给用户“士别三日,当刮目相看”的惊喜。
综合文心一言的整体表现,从某种程度上看它确实具有对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。但文心一言与ChatGPT背后,实际都是SFT(模型微调)、RLHF(强化学习)、Prompt(真实的用户指令)等技术逻辑,这些方法与通过海量无标注数据训练的大模型有明显差距,需要人的参与。
目前来看,这类大语言模型还未到发展完善的阶段,部分场景足够惊艳,但一些场景下也还有bug,存在很大的进步空间。人类向往科技,是期待它能更好地理解人类意图,生成符合人类价值观、表达习惯的回复。这一点上,唯有真实的体验才能带给用户惊喜。
编辑|蒙锦涛