大模型两年：百度与它的“超级应用”还有多远

作者：北京商报发布时间：2024-11-12

“应用来了”，百度世界大会2024年的主题简单明了，11月12日百度CEO李彦宏一上场也紧扣主题，“这代表了百度对当前大模型和生成式人工智能时代的认知和判断”，并从智能体和产业应用两个方向“上新”：可以直播的角色类智能体、可以将照片变成动画的工具类智能体等。

大模型是新的革命还是新的泡沫？李彦宏认为百度有资格回答这个问题，截至11月12日文心大模型日均调用量超15亿，他也承认众所期待的AI超级应用还没有出现。“PC时代的应用是软件和网站，移动时代是App，大模型时代是智能体”，多次强调智能体还不够，李彦宏当天将智能体的重要性拔到新高度。

基本解决幻觉问题

“要想基于大模型开发应用，消除幻觉是必须的”，李彦宏一针见血，“如果这个模型总是一本正经的胡说八道，就不会有人信你，就不会有应用”。

其实，在大模型爆发的两年里，幻觉现象在不同使用场景下的改善程度也不一样。

在李彦宏看来，“大模型是一个概率模型，生成的内容具有不确定性。采用RAG（检索增强生成）技术后，大模型会利用检索到的信息来指导文本或答案的生成，提高内容的质量和准确性。文字层面的RAG已经做得很好了，但图像等多模态内容和RAG的结合还不够”。

他拿两张天坛的图片举例，大模型生成的天坛是四层的，真正的天坛其实只有三层，这就是典型的文生图幻觉现象。回到应用层面，这种幻觉现象目前仍然很普遍，“所以今天的多模态大模型，没有什么成规模的应用出来。就是幻觉没有解决，至少没有像文生文RAG解决得那么好”，李彦宏说。

基于此，百度开发了iRAG技术，即检索增强的文生图技术。该技术将百度搜索的图片资源跟基础模型能力相结合，可以生成各种超真实的图片。

百度CTO王海峰详细介绍称，“百度基于大模型对用户的需求进行分析理解，自动规划精准或泛化方案；接着在增强阶段，对需要增强的实体，检索并选择相应的参考图；最后在生成阶段，自研了多模可控生图大模型。在实际应用中，这个方法也支持用户上传参考图，应用户期望进行生成”。

一些立等可取的现货

不论是热门新能源汽车还是大模型，技术、应用、商业模式都是渐进的过程。就像中欧AI与管理创新研究中心秘书长钱文颖说的，“人工智能目前处于早期阶段，更多是以实验室创新为主。随着技术成熟，企业需要将这些橙黄新应用到实际场景中，满足实际需求，逐步实现商业化”。

当天，李彦宏就展示了iRAG的应用场景：品牌宣传。“试想一下，如果给大众汽车生成的海报，车型长得像丰田”，他开了个玩笑，“之前一组汽车海报拍摄需要一二十万，甚至大几十万元，现在创作成本接近于0，iRAG的商业价值在于：无幻觉、超真实、没成本、立等可取”。

55分钟的演讲中，他提到两次“立等可取”这个词，第二次是谈到“自由画布”时，一个由百度文库和百度网盘联合开发的工具类智能体，核心功能体现在输入、编辑、创作、分享环节。

以创作为例，在划好重点后，用户框选全部需要的素材就能一键生成，根据现场分享的视频，输入一张儿童的照片，加上故事的背景等，自由画布就可以生成一个漫画。

“自由画布可以帮你完成从找资料、到编辑、再到生成和分享的全部任务。每个人都可以成为漫画家、短视频导演”，说到这儿，李彦宏的声音明显提高，“这不是期货，是立即可用的现货”。

和自由画布一样零门槛的还有无代码工具“秒哒”，一个多智能体协作工具。以设计一个萝卜快跑新技术发布会的邀请函为例，包括海报生成、文案生成、嘉宾报名、地图信息展示等，工作人员不需要懂代码就可以完成，用李彦宏的话说，“你不需要去招募项目经理、设计人员、开发人员、测试人员等，自己就可以指挥多个智能体来协同完成任务”。

应用的样貌不一样

一个是智能体，一个是智能体协作工具，李彦宏看好的智能体在百度世界大会2024官宣前、预热时、主论坛演讲和展区都出现在C位。

北京商报记者体验了展区的农民院士智能体。“你好，我是农民院士朱有勇的智能体，你可以通过向我提问，了解旱地优质稻的具体问题解答”，“院士”有问必答。截至北京商报记者发稿，这款智能体在文心智能体平台上的浏览次数11.3万次，帮助2.9万人。整个文心智能体平台上，已吸引15万家企业和80万名开发者参与。

11月12日当天，李彦宏大部分时间也在给智能体打call，他将百度的智能体分为四类：公司类智能体、角色类智能体、工具类智能体、行业类智能体。

“智能体是AI应用的最主流形态，即将迎来它的爆发点”，他再一次强调，“未来公司官方智能体很可能替代官网”，并从PC时代追溯至今，“在人类信息技术变革的不同历史时期，应用出现的样貌也不一样：在PC时期，它是一个个的软件和网站；在移动时期，它是一个个的App和可被关注的账号；在AI时代，应用主要的形态就是智能体”。

应用、智能体为什么屡次被提及？换一个角度或许更容易理解，“正常健康的生态应用是：应用创造的价值>云厂商>芯片GPU（图形处理器）”，零一万物创始人及CEO 李开复说。

北京商报记者魏蔚

大模型两年：百度与它的“超级应用”还有多远

推荐体验

相关资讯

大模型两年：百度与它的“超级应用”还有多远

重塑千行百业的AI大模型，距离大规模应用还有多远？

国产大模型离ChatGPT还有多远？

这两年，还有多少腾讯前员工出来创业做人工智能的？

养了两年，文心一言APP居然换名了，百度要定义“新搜索”？

近期资讯

昆明红星荣和纸业取得纸板制浆低浓度除渣器专利，通过设置可调节安装机构可根据需求调节垂直高度

海信463L冰箱BCD-463WMK1DPJ：国补440元，性价比之选

Win11 命令行效率利器，微软 AI Shell 实测

曝小米15 Ultra即将亮相搭配超大杯骁龙8 Gen2芯

壹号本旗下壹号方糖预告双屏变形安卓掌机，搭载高通骁龙处理器

AOC推多款显示器适用于2K显示器

美的冰箱532MR-532WFPZE：大容量、低能耗，家庭冰箱新标杆

本元智慧取得高效烘干装置专利，实现对废热乏汽的有效利用

超级小爱现已陆续推送，小米14系列、REDMI K70至尊版等将可体验

华为FreeClip耳机最新版本更新：新增多项实用功能！

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响