当前位置:首页|资讯|李彦宏|文心大模型|生成式AI|腾讯|百度

李彦宏宣布文心大模型4.0正式发布,“生成式AI和搜索是天作之合”

作者:腾讯新闻潜望发布时间:2023-10-17

李彦宏宣布文心大模型4.0正式发布,“生成式AI和搜索是天作之合”

腾讯新闻《一线》刘雨点

在百度世界大会2023上,百度董事长兼CEO李彦宏宣布文心大模型的4.0正式发布。他称:“这是我们认为迄今为止最强大的文心的大模型,它的基础模型实现了全面的升级。在理解、生成、逻辑、记忆这四大能力上,相比现在大家线上用的文心一言的版本是有明显的提升。综合水平跟GPT4相比,也已经毫不逊色。”

在他看来,要用理解、生成、逻辑、记忆这四个能力来做应用,才是AI时代的原生应用。

在会议上,李彦宏宣布了几项百度基于AI的业务重构和推出的原生应用。

其中最重要的是,百度搜索已经基于AI大模型完成重构。

李彦宏说,搜索虽然还是从简单的搜索框开始,但是接下来的一步一步都已经超越了、重构了原来的搜索模式,不仅提升了搜索的质量,而且突破了搜索的应用范围,扩大了产品的边界。这样的AI互动式的搜索,将引领搜索行业的代际变革。

他接着说道,在不久的将来,搜索会变成一个贴心的助手,能够随时唤起解决问题,甚至打破端的限制,做到随时随地响应,满足所需,全程陪伴。“生成式AI和搜索其实是天作之合。”李彦宏说。

其次,百度发布AI原生思维产品——百度GBI(Generative Business inteligence),也就是生成式商业智能。他称,这不是重构的产品,而是从零开始做出来的新产品。

他认为,在我们的商业世界里面,其实最离不开的就是商业分析,也就是BI。

百度的GBI从三个方面颠覆了传统的数据分析:首先是传统的BI只有专业人士才能够操作,而GBI能够听懂总裁的问题并实时去执行;其次GBI提供了便捷的接入方式,企业可以接入数据,并且用任意的数据用自然语言来进行提问、分析,而不是像过去需要专业的跨数据库、跨表格去做各种各样复杂的操作;第三是GBI具备学习能力,企业可以注入自己所在行业的专业知识,让GBI成为一个行业专家。

此外,他们将百度智能办公平台如流、百度文库、百度网盘等传统业务也都基于AI进行了重构。

以下为李彦宏演讲文字实录:

李彦宏:各位来宾大家好!欢迎来到2023百度世界大会,欢迎来到生成式人工智能的时代!这次大会的主题聚焦AI原生应用,我会详细跟大家分享在过去几个月百度对旗下各个产品线进行原生化的重构这个过程当中获得的心得和体会,希望对大家能够有所帮助。

众所周知,AI原生应用是基于大模型来开发过去一年,科技领域最大的创新无疑就是大模型带来的智能涌现,这是我们开发AI原生应用的基础。

百度的AI原生应用也是基于文心一言来开发的,大家知道文心一言首发是今年的3月16号,之后我们快速进行迭代,在今年的8月31号又获得了批准向全世界开放。自此之后,其实我们获得的用户反馈也在不断地增多,创新速度实际上是在不断加快的。

今天,我非常高兴地在这里宣布,文心大模型的4.0正式发布了!同时,我们也同步开始邀请测试,今天来到现场的各位朋友,你们只需要扫描自己嘉宾证上的二维码就可以获得邀请测试的权限,你登陆文心一言的官网或者下载最新版的文心一言的APP,就可以体验到文心一言的专业版,它背后就是文心大模型的4.0的版本了。这是我们认为迄今为止最强大的文心的大模型,它的基础模型实现了全面的升级。在理解、生成、逻辑、记忆这四大能力上,相比现在大家线上用的文心一言的版本是有明显的提升。综合水平跟GPT4相比,也已经毫不逊色。

所谓的AI原生应用,我的理解就是基于大模型的理解、生成、逻辑、记忆能力开发出来的应用,因为这些能力是过去的时代所不具备的,所以它才能够打开无限的创新空间。下面,我就结合应用场景来给大家介绍一下文心一言的四大能力,要用这四个能力来做应用,才是AI时代的原生应用。

首先,我们讲一下理解能力。这个能力是我在接触大模型之后,其实感觉最神奇的地方。过去我们讲AI是人工智障,就是AI经常听不懂人话,久而久之就不太敢说太多的人话了。但是,今天你说的每一句话它大概率都能听懂,很多时候比你的同事、朋友更能够懂你在说什么。我们举个例子,假如说你是一位在北京工作的年轻人,你想在河北购房,那么想知道在北京申请公积金贷款行不行。我们来测试一下文心一言的理解能我来给大家演示。(演示)

大家可以看到,这个文心一言回答是可以用公积金贷款的。为什么说这段回答体现了大模型的理解能力?其实刚才我给的PROMPT看似简单,实际上是有好几个小的陷阱的。

首先,这是一个前后乱序的表述,大部分人在打电话提问的时候,他是想到哪儿说到哪儿,不会那么严谨。就像刚才说的PROMPT,我先说了要买房,要办理公积金,最后才说我在北京工作,那么这个对理解能力其实就提出了更高的要求。

第二,我这里头也用了两个比较模糊的表述,一个是说在北京工作,潜台词是说公积金是在北京缴存的。另外是回承德买房,这里头暗示了我大概是承德的户口。

第三,文心一言结合上下文,把所有的信息都组合在一起,准确地理解了真正的问题,就是一个在河北承德户籍的用户能不能用北京的公积金在承德贷款买房?然后再针对这个问题给出相应的回答。

我们可以看到文心一言已经可以对前后乱序的表述、比较模糊意图的表达、话语中的潜台词都进行相当准确的理解,这些能力在政务、营销、客服等等领域,其实都有非常广泛的应用前景。

这是大模型的理解能力,我们再来讲一下大模型的生成能力。大模型可以生成文字、图片、视频各种各样多模态的内容。我们今天来让文心一言生成一套广告素材,我们先给它一张原始的图片,这是一张汽车的图片,然后再来说一段PROMPT。这是长安新推出的新能源车,请帮我生成两张图片,背景是春天,富有生机的景色,同时呈现车的飞驰感。

我们看到生成的结果确实体现到了春天生机勃勃的样子,而且还配上了飞驰的时候的模糊感,这是根据一张原始图片生成两张图片。下面我让它直接生成一个竖版的海报。“结合长安观望上长安启源的信息,做一张竖版的海报,写上简约优雅的文案与车身样式相呼应。”我们生成了一张同时具备文字和图片的竖版的海报。我们再来提更多的要求,我们现在拥有了一张海报,还需要更加丰富的广告文案,可以请文心一言再来写几条。“这款车强调数智座舱、扶光设计、品质驾乘,请再写五条广告文案,每条文案需要包含简短标题和一段描述。”AI写出来的文案,里这样里面有科技之美、时代风潮之类的描述,还强调人机交互,文案是比较专业和流畅的,应该说已经达到了品牌营销使用的标准。

接下来,想让它帮我生成视频广告,“请结合官网信息和已有的视频内容,生成一个数字人的口播视频,我想投放信息流广告。”现在视频已经生成了,我们来看一看播放出来是什么效果。(视频)

这确实是比较有特色的数字人的口播视频,也体现出了这款车的特点。现在我们拥有了一条广告片、五个广告文案,还有一张海报。而我仅仅是给了文心一言一张原始的图片和几个像数智座舱、品质驾乘的词语作为PROMPT,而且全过程只用了不到三分钟。

不久前,我们利用生成功能推出了AIGC营销创意平台擎舵,它是让一个人就可以成为一支AI的营销队伍。今天现场有不少做文案策划的朋友,看到这些你们会不会觉得大模型带来创意上的启发,帮助你们提升效率。

接下来讲第三个能力,逻辑推理的能力。很多人经常给孩子辅导作业,有时候开玩笑说,不写作业母慈子孝,一写作业鸡飞狗跳。文心一言能不能帮助家长解决辅导功课的问题?我现在编一道数学题,看看文心一言的表现。“锥形的沙堆,底面积是8平米,高12公分,把这堆沙子铺在宽两米的路上,厚度5厘米,能铺多少米路?”这是一类小时候都做过的数学题,从文心一言的回答来看,它的逻辑还是非常清晰的,每一个解题的步骤都给了出来,我们的家长们可以看一看这是不是比一些辅导教材上给出来的答案还要更加详细?

甚至AI还能够指出解题当中用到的知识点,帮助我们的孩子巩固和学习,现在我来再问它一下。“上述解题过程都涉及了哪些知识点?”文心一言其实明确给出了这道题涉及到的圆锥体积公式、统一计量单位、体积保持不变,还有解方程等等知识点,这个对于学生、老师、家长其实都很实用。这些知识点都清晰地掌握以后,必将使得孩子具备举一反三的能力。

大模型有着比较超强的逻辑能力,当然这个能力不仅仅可以用在解数学题上,事实上在比如说智能地图的路线策划、智能助理处理复杂任务、智能交通系统的红绿灯的控制等等,其实都需要用到大模型的逻辑能力。

我们再看大模型的第四项能力,记忆能力。这里面的记忆主要指你前面说过的话,AI记不记得住。AI生成的内容,前后会不会产生矛盾,这个是区别大模型智能程度的一个重要指标。我们通过多轮对话,就能够体现出来大模型的记忆能力。很多创作者都在利用文心一言在做小说的创作,而小说的内容如果说前后矛盾的话,那它就没有可读性了。今天我就让文心一言现场写一个小说,然后穿插一些干扰性的问题,看看它能不能记得住自己写过的内容。我来先说一个PROMPT,“请帮我写一篇武侠小说,主人公是个女侠,情节要跌宕起伏一些。”我们看到小说的大纲已经写出来了,首先是故事的背景,在古代的武林世界黑暗势力正在崛起,女主角叫灵儿,拥有操纵内力和飞行的力量。那接下来就是故事的开篇,灵儿要击败黑暗势力拯救武林,在小说的总高潮是她和反派进行了生死决战,击败了反派,拯救了武林和所有门派。最后灵儿和盟友们一起建立了内力修行所。

现在这个故事基本成行了,但是有点简单,我想再增加一些角色的需求。“现在人物关系太简单了,只有两个角色,再增加四个角色。”我们看到文心一言又给出四个角色,每个角色都有不同的身份和性格,有着不同的人设,其中慕容孤城是一代宗师,萧寒雁是预测未来的先知。但是现在缺一个小说中必备的要素,就是戏剧冲突,没有冲突的故事就不是好故事。

刚刚女主打败黑暗势力的过程,也是有点简单,我们看看能不能加大一点难度。“还要给故事增加主线的戏剧冲突,让故事更有可看性。”我们看到它也把戏剧冲突写好了,这里头实际上涉及到一个反转,就是黑暗势力背后真正主导者是一位德高望重的宗师级的人物,好几次让女主陷入了险境,直到决战女主才有了真正反杀的机会。

可以看到它其实是记住了故事的主线是灵儿和黑暗势力的对决,冲突也是围绕这样的主线来展开的。文心一言还记不记得刚才写过的故事,并且把故事和这些角色能够对应上呢?我们再来提下一个需求,“把这些角色带入到你给我设计的故事大纲中吧,并且设计一个标题。”

我们看到结果已经显示在大屏幕上,这篇小说叫做《江湖风云之正义之战》,它补充的人物和戏剧冲突在大纲里头,其中第四章和第五章告诉我们反派宗师其实就是刚刚介绍过的慕容孤城。在整个过程当中,其实我不断地在加大难度,提出新的要求,去干扰它的记忆。文心一言依然记住了前面所有的需求答案,能够把故事情节和人物准确对应上,记忆力是非常不错的。

现在我来考一考在现场的大家,你们还记不记得主人公灵儿具有什么样的特殊能力?大部分人可能不记得了,我们问问文心一言还记得不记得?“女主角拥有的能力是什么?”答案出来了,是操纵内力和飞行的力量,这就是在第一轮对话当中文心一言写下来的文字。现在经过五轮的对话和几千字小说内容的生成之后,它还记得之前写过的内容,这个就是大模型具备的所谓的记忆的能力。

我们刚刚体验了大模型的四大能力,当然这些能力在大部分时候不是单一的体现在产品中的,恰恰相反它都是综合的用,相辅相成。像刚才创作广告文案,它就需要理解创作的主题、厘清创作的逻辑,通过记忆来保持前后一致。在解数学题的过程当中,也是需要综合的运用理解、生成、逻辑和记忆的能力。

我们再来看一个综合应用这四项能力的案例,请看大屏幕。首先我们要打开重构后的百度APP,用摄像头扫一下患者拿出来的药盒,然后就不用再看小字的使用说明书了,这里有数字医医生来帮你进行讲解。(演示)

刚才屏幕上出现的这些问题,比如饭前吃还是饭后吃,喝酒能不能吃,还有什么注意事项等等,都是很多患者在日常用药的过程当中遇到的问题。我们看到大模型不仅可以帮助患者做用药说明书的解读,还可以结合个性化的需求来提升用药效率,确保患者服药的准确性和及时性。

不久前,我们将文心的大模型和专业的医疗知识结合,发布了灵医大模型。它的上层应用灵医bot可以帮助患者和医生对话生成病例,这个例子不仅仅用在理解、生成、逻辑、记忆的能力,而且还有语音、视觉多模态的能力。

前面的演示主要体现文心大模型在理解、生成、逻辑和记忆四大能力上的进步,这些能力可以说是一切的AI原生应用赖以生存的基础,所以我们花了挺大的篇幅来讲解大模型拥有的能力。

但是反过来讲,没有一个构建于基础模型之上的丰富的AI原生应用的生态,大模型其实就一文不值。也正是因为这个原因,我在5月份的时候就公开讲说,“百度要做第一个把所有的应用都重做和重构的公司,我们要用AI的思维做出AI时代的原生应用”。现在几个月过去了,我们的搜索、如流、地图、网盘、文库等等产品,都将以一个全新的面目跟大家见面,当然这中间踩过不少坑,我也愿意拿出来跟大家分享,希望你们在开发过程中少走弯路。下面我就给大家展示一下这些用大模型重构过的产品到底长什么样,我相信能够帮助大家拓展你们的想象力,激发大家一起来做出更惊艳的AI的原生应用。

我首先向大家展示我们的搜索因大家知道这是百度的起点。很多人对搜索的印象,还是你输入一个关键词,然后百度给你一个一个的网页链接。

百度的新搜索在打开界面的时候除了看到一个搜索框,就是你的使用习惯不用变,搜索结果和过去相比就完全不一样了。重构后的新搜索它有三个特点:极致满足、推荐激发和多轮交互。

什么是极致满足?当你在搜索框里输入问题,比如说MBTI是什么?怎么侧方停车?新的搜索不是给你一堆堆的链接,而是通过大模型去理解,然后生成一个最好的答案。比如我们询问“过去二十年,各国工业增加值排名”,新的搜索不仅会直接告诉你答案,还可以用动态的图表来展现这个答案。从我身后的大屏幕可以看到,在过去二十年我们的工业制造经历了飞速的发展,中国从制造大国正在向制造强国转变,这就是所谓的极致满足,也就是一步给你最极致的答案。

第二步在看到这些极致答案之后,你还想看什么内容?这就是我们讲到的推荐激发。比如在动态图之后,推荐激发功能就再给你提示一些工业增加值和GDP有什么关系?工业对国民经济发展有什么影响?这些你有可能关心的问题,点击之后也能大家相应的答案。

大家也知道并不是所有需求都有一个唯一正确的答案,用户的需求有时候会很复杂,有时候自己都没想清楚真实需求是什么。即使想清楚了,一两句话也说不清楚,所以我们很难要求一个用户把非常复杂的要求一次性通过大段的描述来完整表述出来。这个时候怎么办?我们就要用更加新颖的、更有个性化特点的搜索模式来服务用户,这就是我们的多轮交互。

我们来看一下这个例子。比如你在询问“北京周边登山去哪儿比较推荐?”它给出了多个答案,也比较偏向走徒步路线。然后它又给了几个提示,让你补充选择自己的情况,你可以选择新手、亲子、观赏落叶的几种情况。现在它改为推荐西山和百望山,相对好爬,而且对亲子活动也是比较友好的。再继续提问“登山徒步需要什么装备”,回答有登山杖、登山鞋等等。它还记得前面选择了亲子游,特别提示了怎么照顾小朋友。所以生成式AI和搜索其实是天作之合!

搜索虽然还是从简单的搜索框开始,但是接下来的一步一步都已经超越了、重构了原来的搜索模式,不仅提升了搜索的质量,而且突破了搜索的应用范围,扩大了产品的边界。这样的AI互动式的搜索,将引领搜索行业的代际变革。

在不久的将来,搜索会变成一个贴心的助手,能够随时唤起解决问题,甚至打破端的限制,做到随时随地响应,满足所需,全程陪伴。

下面,我们来看第二个AI原生思维的产品,叫做百度GBI(Generative Business inteligence),也就是生成式商业智能。这不是重构的产品,而是从零开始做出来的新产品。在我们的商业世界里面,其实最离不开的就是商业分析,也就是BI。怎么做出最快的商业决策?现在请大家通过一个视频来感受一下。(视频)

大家看到刚才视频里头总裁是问了很多非常专业的问题,有财务分析的,有项目交互的,还有用户分析的,运用了GBI的总裁助理都能够很快地给出来结果,让这位总裁当场决策。这就是基于大模型的能力做出来的决策利器,也是国内首个生成式商业智能产品百度GBI。刚才说,用GBI干啥都快,确实此言不虚。掌握先进工具的人不仅不会被AI所取代,而且可以说升职加薪不是梦,反而不适用先进工具的人反而有丢掉工作的风险。

百度的GBI是怎么做到快人一步的?其实从三个方面颠覆了传统的数据分析:首先是传统的BI只有专业人士才能够操作,而GBI能够听懂总裁的问题并实时去执行;其次GBI提供了便捷的接入方式,企业可以接入数据,并且用任意的数据用自然语言来进行提问、分析,而不是像过去需要专业的跨数据库、跨表格去做各种各样复杂的操作;第三是GBI还具备学习能力,企业可以注入自己所所行业的专业知识,让GBI成为一个行业专家。这就是百度GBI,可以把商业分析师十几天完成的分析、撰写、报告缩短到分钟级,所谓天下武功唯快不破,企业竞争不是大鱼吃小鱼,而是快鱼吃慢鱼,这些话我们听了很多,但是今天真正拥有利器了。当你比竞争对手能够更快的决策,很可能你就赢了。

说到快速决策,在百度我们依赖智能办公平台:如流。我们也利用AI重构了这个应用,如今已经成为百度人离不开的超级助理。现在大家请看,这个是如流在做实时的记录,我们看看它是不是能够把刚才讲过的要点内容都记住。(视频)

这是如流会议纪要一键生成功能,如流的这个功能极大的减少了会议的工作量,让开会的时间缩短了40%。

另外的工作场景是工作群,大量的职场人常常被各种各样群聊信息所轰炸,快速总结群聊的重点就成为极其实用的功能。下面请大家看一看如流的产品经理是如何使用它的。(视频)

他有9个工作群,耽搁半天时间可能上千条未读信息。如流不仅可以一千条信息一秒钟get重点,还可以智能地把需要阅读的内容分为带我确认、重点关注、话题讨论几个类别,这样就大大提高了工作效率。它究竟提炼的准不准,会不会理解有错误或者漏掉一些关键信息?这就是考验大模型的理解能力和生成能力,理解越深刻,总结就越精确,不要说一千条,哪怕是一万条,如流的超级助理也一样可以在几秒钟之内给出智能的分类和智能的总结。

我们再看工作另外的场景,就是差旅。机票、酒店、谈参这些非常繁杂,也非常耗时间。如果人手都有AI助理,帮助你解决琐碎的事,你是不是会更喜欢你的工作一些?比如最近我们的如流产品经理计划出差去上海和人保的王总见面。我们知道人保集团正在推动产品、服务、商业模式、数字科技等等方面的创新,百度的人工智能技术正好可以在这里发挥作用。这次出差的行程安排就可以交给如流超级助理,我们一起来看一看它的表现。(演示)

超级助理可以根据日程信息来安排行程,像比如说最晚的会议是4点钟结束,飞机就要预定到7点半以后,以及按照他的差旅标准帮助他找到可以住宿的酒店,最后向客户发出了会邀。

与客户见面之前需要合作的背景,这一点如流的超级助理也可以帮他完成。通过与公司的系统数据,比如CRM数据打通,如流就给出了合作项目、拜访记录等等细节的数据。

通过理解业务合作情况和外部的信息,如流帮他生成了一份谈参,预设客户可能提出的问题,还给出了一些合作的建议。从这一点上,大家看如流的超级助理是不是真的很像一个真人的助理?

我们刚刚看到只用三句话,如流就搞定了差旅单、机酒、日程的预定,甚至准备了洽谈的参考资料,这就是如流的一键差旅。这是怎么做到的呢?这个就是大模型的理解生成、理解、记忆、逻辑的综合应用,把复杂的任务拆解成多个简单的任务分别去执行,再合并成最终的结果。提升效率就是提升竞争力,而如流让智能工作代替了勤奋工作。

现在再来看下一个产品,百度文库。这也是我认为目前重构的最彻底的一款产品,百度的文库将彻底颠覆办公、学习和创作的习惯。过去是怎么创作的?假如说你要做一场演讲,比如讲AI在心理学领域的应用,查资料、整理素材、写稿、写PPT、美化PPT,你得花上好几天的时间。今天在百度文库上可以用一句话启动这项工作,请看大屏幕。首先你希望它撰写一篇演讲稿,围绕人工智能和心理学的主题让它找到几十份的资料。它还能识别出来哪些是学术期刊、权威报告,哪些只是大众的材料。如果想写一篇生动活泼的文章就写大众素材,比如散文、科普类文章。但是如果你要想写一篇严谨的学术演讲稿,就可以只勾选权威的内容,保证内容的准确性。然后文库通过理解这些文稿资料,再生成一个结构完整、段落清晰的文章,同时对内容做出润色和排版。能做谁到一些,是因为百度文库已经拥有了十亿优质的文档,基于这些内容可以写出来真正实用的清晰的文稿,而不是像很多大模型一样一本正经的胡说八道,它也不会泛泛地去空谈。

下一步演讲还需要PPT,文库可以把刚刚这篇稿子和你收藏过的一些资料相结合,自动生成PPT框架,然后再美化作图,做出几十页的PPT。

这里还有一些多模态的生成能力的玩法,比如说风格的选择、风格的一键切换。但是还有一些更考验文库能力的地方,就是需要对内容有精准的理解。比如需要知道观点之间的关系是并列关系,还是从属关系,这样才能设计出来正确的图表。因为有这样的理解能力,文库在生成PPT的基础上,还可以把这份PPT对应的演讲稿也给你写出来。不仅如此,它还能根据这些内容推演出观众可能会提出什么问题,然后问你准备好这些问题的答案。

我们评测过,文库这些生成能力,尤其是PPT的生成能力,已经远超了市场上任何的其他工具。无论是国外的,还是国内的工具。过去人们来文库是为了找现成的内容,今后可以随心所欲来文库生产内容,效率高于任何其他的生产力工具。基于文心大模型的四大能力,毫不夸张地说,百度文库已经从根本上革了自己的命,它完成了从一个内容工具向生产力工具的进化。

不久之前,百度文库新版本开放的第一天,AI的这些新功能就迎来了超过200万人次的体验。现在,我们可以更加有信心地说“大模型时代百度文库是生产内容最好的起点”。

与文库一样,百度网盘是大家非常熟悉的老朋友。过去十一年,网盘为8亿用户提供服务,文件量级超过4万亿,每一天都有用户上传图片超过10亿张,所以百度网盘在重构的方向上重点就是要做好个人文件的智能服务。

大家看到百度网盘新的首页,重构之后的百度网盘不但实现了从图形交互界面到自然语言交互界面的转变,还增强了多模态信息理解的能力。现在只要一句话就能够对自己网盘里头的文件、图片、视频来进行操作,我们这个功能叫做百度网盘的云一朵,它是业界乃至全球首个个人云的智能助理。现在我们就来感受一下云一朵能够解决哪些痛点,带来什么样的新体验。

第一,找图片或视频。有时候明明想起来一个画面,知道它存在网盘当中,但是要找到这个东西往往需要很多步的操作,甚至折腾半天也没找到。现在你对云一朵说一句话,它就能够帮你精准地定位。

它帮我快速地找到了OpenAI首席科学家eliassource (音)采访当中关于Transformer的内容。在看似简单的搜索背后,实际上是多个AI能力在起作用,它需要理解视频的内容,识别里面不同的角色,还要对上下文有记忆,才能精准定位到视频当中的某一帧。这个技术,其实在全球都是非常领先的。

第二,帮助用户快速了解视频的内容。大家看到演示了两个能力,一个是对内容进行总结和摘要的能第二个是提取金句的能力。这是一段长达43分钟的采访,我们通过AI的理解和逻辑能力,云一朵对视频做了提炼和总结,介绍了他的主要观点。很多时候我们觉得原文很精彩,提炼出来的主要观点或摘要之后就没有那么吸引人了,所以刚才第二个功能其实对我来说更有用,也就是要找到原来视频当中最精彩的部分,就是那些金句。比如他说学习统计规律比眼见为实要重要得多,提炼出来这个金句在其中的关键突破就是实现了多模态信息的高效提取,这个技术在全球也是非常领先的,它能够从很长的访谈当中找到最精华的部分,极大的提高了学习和工作的效率。

这就是我们用AI重构后的新网盘,截止到昨天云一朵的用户已经达到了2000万,它是基于个人云的AI智能助理。如果说过去十年百度定义了什么叫做网盘,那么未来十年百度将用AI重新定义新的网盘。

接下来来看一个更为历史悠久的产品,就是百度地图。我们用AI原生思维重构了已经走过了18年路程的产品,这也是全球首个AI原生地图产品。

在过去的18年当中,百度地图积累了非常丰富的功能,它可以导航、打车、找代驾、订酒店、买机票,甚至满足更为复杂条件下的POI的查找寻求。过去这些操作非常复杂,往往需要六七步,甚至有些功能需要大概二十步以上才能够完成。现在用户只要说出其中的需求,地图就可以调动几千个服务的API接口来把多级菜单变成一步直达、快速响应。我们接下来看一下百度地图是怎么实现的。(视频)

在这个视频里面,用户考验了百度地图对于泛需求的理解,中间聚会地点的选取,多个地点的信息对比,以及对于未来出行的推荐和预约,它都给出了非常合理的答案。这就是因为文心一言的能力已经跟地图特有的亿级POI的信息,以及万亿级交通感知的数据进行了融合,能够随时调用给出推荐。

重构之后的百度地图,不只是导航,它更是我们的出行向导,可以说是越用越聪明,越来越懂你。

刚刚我们展示了六个线上的AI原生应用,但是大模型带来的改变不仅如此,它其实也影响着我们线下的工作和生活。比如说用大模型来重构汽车的车内空间,是否能够给我们带来惊喜?现在来看一段本月底即将交付的集度极越的视频。(视频)

大模型和智能座舱进行结合,你跟它交互越多就会越理解你的需求,不再需要复杂的各种各样的按键操作,用语音就能够操控车内的一切,让智能座舱拥有逻辑推理、策略规划和内容生成等各种的能力。即使是刚才那种环境七嘴八舌、多人指令、声音交织、连续对话的情况下,它也能理解每个人不同的需求,并且同时满足它。这些能力首先落地在由集度设计的极越01的机器人上,百度机器人在EQ和IQ两个方面全面赋能这款新车,极越01也将成为最聪明、最懂你的汽车机器人。

今天我相信大家已经感受到了AI巨大的能量,我更相信大模型将开启一个繁荣的AI原生应用的生态。说到生态,我们就不能不提插件,插件非常重要,它可以让开发者、创业者快速融入到新的生态当中去。可以说插件是一种特殊的AI原生应用,因为门槛最低,最容易上手。不久之前,百度也上线了灵境插件平台,无论是个人或者企业的数据、能力或应用,都能够在灵境平台上快速变成一个插件。

我们举个例子,你从网上买了东西,卖家发货跟实物不符,这个时候你想咨询一下怎么要求赔偿。这里头的法律智能助手就可以给出建议,因为它接入了中国司法大数据研究院这样的官方权威机构提供的插件。再比如毕业求职季写简历,你想做一名AI算法工程师,没问题!我们只要输入包含背景信息的PROMPT,大模型通过调用插件就能够帮你一键生成简历模板。

插件增强了大模型的能力,让它更加实用,也更易用,使得很多企业的私有数据在没有泄漏风险的情况下,能够方便快捷地利用到最先进的大模型的能力,能够降低我们开发者的开发门槛,能够促进AI生态的快速成长和繁荣。

现在灵境的插件平台上线其实短短的只有一个月的时间,我们已经有2.7万个开发者的申请入驻,覆盖了20多个领域。除了法律咨询、简历生成,还有像脑图制作、口语练习等等各种各样的场景。

原生应用其实调用基础大模型的主要方式,应该说是API。在百度的千帆大模型平台上,企业可以快速调取包括文心一言在内的各种各样的大模型的API来获得这些大模型的能力。今天,千帆大模型平台已经成为了中国最大、最开放的大模型开发平台,不仅有42个主流的大模型入驻,而且有17000家企业在这里开发产业模型和解决方案。同时,我们也覆盖了将近500个不同的场景。我在这里也告诉大家,从今天开始,我们的企业客户也可以通过千帆来申请测试文心4.0的API了。

我们中国有丰富的应用场景,中国的用户又天然愿意拥抱新的技术,现在有的先进的基础大模型就可以构建起来一个非常繁荣的AI原生应用的生态,就可以共同创作新一轮的经济增长。

随着这一波AI浪潮的到来,有些人会担心自己会不会被AI所取代。但是,我们看到的实际情况是AI不仅不会取代人,AI还能救人。(视频)

十秒钟完成预警,十分钟完成救援,哪怕是在瞬息万变的现实世界里,AI也能够根据风险排查的逻辑对复杂的图像、语言的理解第一时间找到潜在的风险点,发出预警,避免悲剧的发生。

最后我还想说,未来的AI原生应用一定是多模态的。在信息世界之外,一定会重构我们的物理世界。而自动驾驶其实就是视觉大模型重构物理世界的一个典型应用。

大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂的场景,实现更为广泛的时空覆盖。下面我就请我的同事带大家来感受一下,请看大屏幕。(视频)

今天萝卜快跑已经是全球最大的自动驾驶出行服务商,累计已经提供了超过400万次的载客服务。萝卜快跑的全无人车已经跑在了武汉、重庆、北京、上海、深圳等很多城市的多个区域,我相信随着运营规模的不断扩大,技术水平的不断提升,成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化的盈利,让我们共同期待AI原生出行时代的到来!

随着大模型技术的不断提升,我坚信从今往后大量的AI原生应用将不断地涌现,数字技术和实体经济将深度融合,我们的大模型技术已经应用在了制造、能源、电力、化工、交通等各种各样的实体产业当中了。用智能巡检来降低安全隐患、用智能调度来缩短交付周期、用智能决策来提升企业的效率、用智能信控来解决交通拥堵,大模型正在成为新型工业化的重要推动力。

《时代周刊》在一篇封面文章当中写到,“AI的独特性是它不仅能够模仿人的某些技能,还能够执行我们难以完成的任务。然而,推动机器学习和大语言模型的每一次进步的背后,其实都是人类。”

对于这句话,我非常赞同!新的世界,新的未来,将在每一个企业、每一个开发者、每一位用户的一次次PROMPT当中生成。我们将进入一个AI原生的时代,我们将进入一个人机通过PROMPT来相互交流的时代,未来由你生成,未来由我们一起一起生成,谢谢大家!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1