“应用来了”,百度世界大会2024年的主题简单明了,11月12日百度CEO李彦宏一上场也紧扣主题,“这代表了百度对当前大模型和生成式人工智能时代的认知和判断”,并从智能体和产业应用两个方向“上新”:可以直播的角色类智能体、可以将照片变成动画的工具类智能体等。
大模型是新的革命还是新的泡沫?李彦宏认为百度有资格回答这个问题,截至11月12日文心大模型日均调用量超15亿,他也承认众所期待的AI超级应用还没有出现。“PC时代的应用是软件和网站,移动时代是App,大模型时代是智能体”,多次强调智能体还不够,李彦宏当天将智能体的重要性拔到新高度。
基本解决幻觉问题
“要想基于大模型开发应用,消除幻觉是必须的”,李彦宏一针见血,“如果这个模型总是一本正经的胡说八道,就不会有人信你,就不会有应用”。
其实,在大模型爆发的两年里,幻觉现象在不同使用场景下的改善程度也不一样。
在李彦宏看来,“大模型是一个概率模型,生成的内容具有不确定性。采用RAG(检索增强生成)技术后,大模型会利用检索到的信息来指导文本或答案的生成,提高内容的质量和准确性。文字层面的RAG已经做得很好了,但图像等多模态内容和RAG的结合还不够”。
他拿两张天坛的图片举例,大模型生成的天坛是四层的,真正的天坛其实只有三层,这就是典型的文生图幻觉现象。回到应用层面,这种幻觉现象目前仍然很普遍,“所以今天的多模态大模型,没有什么成规模的应用出来。就是幻觉没有解决,至少没有像文生文RAG解决得那么好”,李彦宏说。
基于此,百度开发了iRAG技术,即检索增强的文生图技术。该技术将百度搜索的图片资源跟基础模型能力相结合,可以生成各种超真实的图片。
百度CTO王海峰详细介绍称,“百度基于大模型对用户的需求进行分析理解,自动规划精准或泛化方案;接着在增强阶段,对需要增强的实体,检索并选择相应的参考图;最后在生成阶段,自研了多模可控生图大模型。在实际应用中,这个方法也支持用户上传参考图,应用户期望进行生成”。
一些立等可取的现货
不论是热门新能源汽车还是大模型,技术、应用、商业模式都是渐进的过程。就像中欧AI与管理创新研究中心秘书长钱文颖说的,“人工智能目前处于早期阶段,更多是以实验室创新为主。随着技术成熟,企业需要将这些橙黄新应用到实际场景中,满足实际需求,逐步实现商业化”。
当天,李彦宏就展示了iRAG的应用场景:品牌宣传。“试想一下,如果给大众汽车生成的海报,车型长得像丰田”,他开了个玩笑,“之前一组汽车海报拍摄需要一二十万,甚至大几十万元,现在创作成本接近于0,iRAG的商业价值在于:无幻觉、超真实、没成本、立等可取”。
55分钟的演讲中,他提到两次“立等可取”这个词,第二次是谈到“自由画布”时,一个由百度文库和百度网盘联合开发的工具类智能体,核心功能体现在输入、编辑、创作、分享环节。
以创作为例,在划好重点后,用户框选全部需要的素材就能一键生成,根据现场分享的视频,输入一张儿童的照片,加上故事的背景等,自由画布就可以生成一个漫画。
“自由画布可以帮你完成从找资料、到编辑、再到生成和分享的全部任务。每个人都可以成为漫画家、短视频导演”,说到这儿,李彦宏的声音明显提高,“这不是期货,是立即可用的现货”。
和自由画布一样零门槛的还有无代码工具“秒哒”,一个多智能体协作工具。以设计一个萝卜快跑新技术发布会的邀请函为例,包括海报生成、文案生成、嘉宾报名、地图信息展示等,工作人员不需要懂代码就可以完成,用李彦宏的话说,“你不需要去招募项目经理、设计人员、开发人员、测试人员等,自己就可以指挥多个智能体来协同完成任务”。
应用的样貌不一样
一个是智能体,一个是智能体协作工具,李彦宏看好的智能体在百度世界大会2024官宣前、预热时、主论坛演讲和展区都出现在C位。
北京商报记者体验了展区的农民院士智能体。“你好,我是农民院士朱有勇的智能体,你可以通过向我提问,了解旱地优质稻的具体问题解答”,“院士”有问必答。截至北京商报记者发稿,这款智能体在文心智能体平台上的浏览次数11.3万次,帮助2.9万人。整个文心智能体平台上,已吸引15万家企业和80万名开发者参与。
11月12日当天,李彦宏大部分时间也在给智能体打call,他将百度的智能体分为四类:公司类智能体、角色类智能体、工具类智能体、行业类智能体。
“智能体是AI应用的最主流形态,即将迎来它的爆发点”,他再一次强调,“未来公司官方智能体很可能替代官网”,并从PC时代追溯至今,“在人类信息技术变革的不同历史时期,应用出现的样貌也不一样:在PC时期,它是一个个的软件和网站;在移动时期,它是一个个的App和可被关注的账号;在AI时代,应用主要的形态就是智能体”。
应用、智能体为什么屡次被提及?换一个角度或许更容易理解,“正常健康的生态应用是:应用创造的价值>云厂商>芯片GPU(图形处理器)”,零一万物创始人及CEO 李开复说。
北京商报记者 魏蔚