极目新闻记者 黄永进 发自上海
11月12日,百度世界大会上,百度董事长李彦宏透露,百度文心大模型日调用量达到了15亿次,半年增长率达7.5倍。
“过去24个月,AI行业发生的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码工具“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长约30倍。李彦宏表示,“这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。”演讲中,李彦宏再次强调,智能体是AI应用的最主流形态,即将迎来爆发点,它将成为AI原生时代,内容、信息和服务的新载体。
过去24个月,AI行业的最大变化是大模型基本消除了幻觉
“去年三月,文心一言发布的时候,我们说百度大模型的特色是知识增强、检索增强。后来发现,检索增强不是百度特色,而是逐步成为了行业的共识。”
李彦宏表示,检索增强的意义在于让大模型基本消除了幻觉。他认为即使是文学创作,也需要故事前后保持一致。
“所以,如果你要问我,过去这24个月,对这个行业而言,最大的变化是什么?我的回答一定是,大模型基本消除了幻觉,它回答问题的准确性大幅提升了,这让AI从‘一本正经的胡说八道’,变得可用、可被信赖。我们知道,大模型是一个概率模型,生成的内容具有不确定性。采用RAG技术后,大模型会利用检索到的信息来指导文本或答案的生成,从而极大地提高了内容的质量和准确性。”
如今,文字层面的RAG已经做得很好了,但是图像等多模态内容和RAG的结合还不够。他以一个开源模型生成的一张北京天坛的图片为例,真正的天坛是3层,但模型生成了4层,这是文生图比较典型的幻觉现象。这种幻觉现象,今天仍然很普遍,所以今天的多模态大模型,没有什么成规模的应用出来,就是幻觉没有解决。
“今年年初,我们决定要解决图像生成的幻觉问题。我们开发了一项颠覆性的技术叫做iRAG,就是image based RAG,检索增强的文生图技术。之前,完全基于大语言模型的文生图系统,生成的图片常常是“一眼假”,甚至是逻辑不合常理。百度的iRAG,将百度搜索的亿级图片资源跟强大的基础模型能力相结合,就可以生成各种超真实的图片,整体效果远远超过文生图原生系统,去掉了机器味儿。”李彦宏表示,“随着AI生成图片的可用性大大提高,它的应用空间也随即打开了。比如在品牌宣传场景,以前拍这样一组海报动辄需要一二十万,甚至大几十万,但是现在创作的成本接近于0。简单说来,iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。”
当基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻
“基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。每一个应用都是一颗星,每一个应用都将成为改变世界的力量。那么AI应用从哪里来?到哪里去?有两大AI应用方向:一个是智能体,另一个是产业应用。”
“智能体是AI应用的最主流形态,即将迎来它的爆发点。今天,全球所有顶尖科技公司都很关注智能体,但像百度这样把智能体作为最重要战略方向的并不多。我认为,做智能体很像PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像你的销售,你的客服,你的助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
“目前,文心智能体平台上,已经吸引了15万家企业和80万名开发者参与,覆盖的应用场景非常非常多。文心智能体平台的TOP100智能体是我们基于智能体的分发量、平均对话轮次、用户喜爱度等指标综合遴选出来的。有角色类的,像农民院士智能体,有工具类、行业类的智能体,更有职场、情感、娱乐等类型的智能体。”
(来源:极目新闻)