分享嘉宾:百度 李彦宏
现场记录:创业黑马
世界回到以前的模样,有人说Robin在台上一本正经讲广告,都透漏出科技产品的未来感和好奇心。那是台上和台下,公司和用户,对科技未来的希冀和共鸣。
2023百度世界大会是百度年度最重要的战略、技术、产品发布会,自2006年以来已经持续举办17年。
10月17日,创业黑马受邀参加百度世界大会,现场记录下10条重要内容,并将李彦宏演讲全文进行了整理,一起分享给大家。
1、欢迎来到生成式人工智能时代!过去一年,科技领域最大的创新是大模型带来的智能涌现,这是开发AI原生应用的基础。文心大模型4.0正式发布,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着明显提升,综合水平与GPT-4相比毫不逊色。
2、AI原生应用,就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用。这些能力是过去的时代所不具备的,因而能够打开无限的创新空间。
3、生成式AI与搜索是天作之合。百度搜索已经基于AI大模型完成重构,新搜索具有极致满足、推荐激发和多轮交互三个特点。不仅提升了搜索质量,而且突破了搜索的应用范围、扩大了产品边界。
4、百度GBI是国内首个生成式商业智能产品,它可以把商业分析师十几天才能完成的数据分析、撰写报告的工作,缩短到分钟级,是基于大模型能力的决策利器。
5、百度文库是AI重构最彻底的产品。基于大模型重构的百度文库亮相,从“内容工具”变身“生产力工具”。它在理解资料、撰写文章、PPT智能生成、风格切换等功能上快速进化。
6、百度网盘已完成AI重构。个人云智能助理“云一朵”,实现从图形界面交互到自然语言交互的转变,增强了多模态信息理解,能对视频精准定位、一键总结视频内容、提炼金句,技术全球领先。
7、插件是一种特殊的AI原生应用,门槛最低、最容易上手。插件增强了大模型的能力,让它更实用、更易用,也使得很多企业私有数据在没有泄露风险的情况下能方便快捷地利用到大模型的能力。
8、未来的AI原生应用一定是多模态的,自动驾驶是视觉大模型重构物理世界的典型应用。
9、百度正大力推动数字技术与实体经济的深度融合,大模型技术已应用在制造、能源、电力、化工、交通等实体产业中,用智能巡检降低安全隐患、用智能调度缩短交付周期、用智能决策提升企业效率、智能信控解决交通拥堵,大模型正成为新型工业化的重要推动力。
10、我们即将进入一个AI原生的时代,一个人机通过prompt交互的时代!
先关注 慢慢看
以下为百度创始人兼CEO李彦宏的演讲全文,经创业黑马整理编辑:
各位来宾,大家好!欢迎来到2023百度世界大会!
欢迎来到生成式人工智能的时代!
这次大会的主题是AI原生应用。我会详细跟大家分享,过去几个月,百度在对旗下各个产品线,进行AI原生化重构过程中的心得体会,希望对大家有帮助。
众所周知,AI原生应用是基于大模型来开发的。过去一年,科技领域最大的创新无疑是大模型带来的智能涌现,这是我们开发AI原生应用的基础。
所以,百度的AI原生应用也都是基于我们的文心一言来开发的。文心一言自今年3月16日首发,之后我们迅速迭代,8月31日又获准向全世界开放,获得了大量的用户反馈,创新的速度在不断加快。
今天,我很高兴地宣布,文心大模型4.0正式发布。
我们也同步开始邀请测试。各位现场的朋友,只需要扫描嘉宾证上的二维码,领取体验券,就可以登录文心一言官网或者文心一言App,体验文心大模型4.0了。
这是迄今为止最强大的文心大模型,它实现了基础模型的全面升级,理解、生成、逻辑和记忆四大能力,相比文心一言现在的版本都有明显提升,综合水平与GPT4相比已经毫不逊色!
所谓AI原生应用,我的理解,就是基于大模型的理解、生成、逻辑和记忆能力开发出来的应用。这些能力是过去的时代所不具备的,因而才能打开无限的创新空间。
下面我就结合应用场景,给大家介绍一下文心一言的这四大能力。有了这四个能力的应用,才是AI时代的原生应用。
首先是理解能力。这是我接触大模型之后感受最神奇的地方。
过去我们讲AI是“人工智障”,就是AI经常听不懂人话,久而久之,你也就不敢跟它说太多人话了。
今天,你说的每一句话,它大概率都能听懂,很多时候比你的朋友同事更懂你在说什么。
举个例子,你是一位在北京工作的年轻人,想在河北购房,想知道能不能在北京申请公积金贷款。
我们来输入一行Prompt。
【我想回承德买房,能用公积金贷款吗,手续怎么办?我在北京工作。】
我们来看一下结果。文心一言回答说,可以用公积金贷款。为什么说这段问答体现了大模型的理解能力?其实刚才我给的Prompt,看似简单,有好几个小陷阱需要理解:
首先,是一个前后乱序的表述。大部分人打电话提问的时候,都是想到哪儿说到哪儿,不会那么严谨,就像这个Prompt,我先说了买房和办理公积金,最后才说“我在北京工作”,这就对理解能力提出了更高的要求。
第二,我这里特意用了两个比较模糊的表述。一个是“在北京工作”,潜台词是“在北京缴存公积金”,另一个是“回承德购房”,仅仅一个“回”字,其实暗示了我大概率是承德户口。
第三,文心一言结合上下文,把所有信息点组合在一起,准确理解了真正的问题,也就是“一名河北承德户籍的用户,能不能用北京的公积金,在承德贷款购房”,然后针对这个问题给出了回答和办理步骤。
可以看到,文心一言已经可以对“前后乱序的表述,比较模糊的表达意图,话语中的潜台词”,都进行相当准确的理解。这种能力,在政务、营销、客服等领域,都有非常广泛的应用前景。
大模型的第二个重要能力是“生成”,可以生成文字、图片、视频等多模态内容。
那么生成能力怎么用?我让文心一言生成一套广告素材。
先给它输入一张图片,再输入一段Prompt。
【这是长安新推出的新能源车。请帮我生成两张图片,背景是春天、富有生机的景色,同时呈现车的飞驰感。】
我们看到,这个生成结果确实用到了春天生机勃勃的户外景色,还配上了飞驰的模糊感。
我让它直接给我生成一个竖版海报。
【结合长安官网上的长安启源这款车型的信息,做一张竖版广告海报,写上简约优雅的营销文案,与车身样式相呼应。】
大家看到,我们生成了一个同时具备图片和文字的竖版广告海报。
我们现在拥有了一张广告海报,还需要更丰富的广告文案,可以请文心一言再来写几条:
【这款车强调数智座舱、扶光设计、品质驾乘。请再写5条广告文案,每条文案都需要包含简短标题和一段描述】
AI写出来的文案,里面有科技之美、时代风潮这一类表述,还强调了人机交互,文案是比较专业和流畅的,已经达到了品牌营销的标准。
那如果我还想要个视频呢?
【请结合官网信息和已有的视频内容,生成一个数字人的口播视频,我想投放信息流广告。】
已经生成了,那我们打开视频看看效果。
这确实是个比较有特色的数字人口播视频,也体现出了这个车的特点。
现在,我们拥有了1条广告片、5个广告文案和1张海报,而我仅仅给了文心一言一张图片素材和几个像是“数智座驾”“品质驾乘”的词语作为Prompt,全程只用了不到3分钟。
不久前,我们也利用这个功能推出了AIGC营销创意平台擎舵,让一个人就成为一支AI营销队伍。今天现场可能也有一些做文案策划的朋友,看到这些,你们会不会觉得,大模型可以带来更多创意上的启发,帮助你们提高效率?
接下来,我们讲一讲大模型的第三个能力:逻辑。
很多人经常要给孩子辅导作业。有人开玩笑说,“不写作业母慈子孝,一写作业鸡飞狗跳”。那我们来看看,文心一言能不能帮家长解决辅导功课的问题?
我来编一道数学题,看看表现如何:
【锥形的沙堆,底面积是8平方米,高12分米,把这堆沙子铺在宽2米的公路上,厚度5厘米,能铺多少米路?】
这是一类我们可能小时候都做过的数学题,从文心一言的回答看,它的答题逻辑还是挺清晰的。每一个解题步骤都写了出来。家长们可以看看,是不是比一些辅导教材上给出的还要详细。
甚至,AI还能指出解题中用到的知识点,帮助孩子们巩固学习,让我们再问它一下:
【上述解题过程都涉及了哪些知识点?】
文心一言明确给出了这道题涉及到的圆锥体积公式、统一计量单位、体积保持不变、解方程等知识点。这对于学生、老师和家长都很实用。这些知识点都清晰的掌握后,将使孩子们具备举一反三的能力。
大模型超强的逻辑能力,当然不仅仅可以用在解题上。智能地图的路线规划、智能助理处理复杂任务、智能交通系统中的红绿灯控制等等,都需要利用逻辑能力。
接下来,我们再看第四点,也就是大模型的记忆能力。
这里的记忆,主要指的是你前面说过的话,AI记不记得住,AI生成的内容,前后会不会矛盾。这是区分大模型智能程度的一个重要指标,多轮对话就是记忆能力的体现。
我知道,很多创作者都在利用文心一言写小说。而小说的内容如果前后矛盾,那就没有可读性了。今天,我就让它现场写个小说,然后穿插一些干扰性问题,再看看它能不能记住自己写过的内容。
我先输入一个Prompt:
【请帮我写一篇武侠小说,主人公是个女侠,情节要跌宕起伏一些。】
好,我们看,小说的大纲已经出来了:
首先是故事背景,在古代的武林世界,黑暗势力正在崛起;女主角叫灵儿,拥有操纵内力和飞行的力量。
我先输入一个Prompt:
【请帮我写一篇武侠小说,主人公是个女侠,情节要跌宕起伏一些。】
好,我们看,小说的大纲已经出来了:
首先是故事背景,在古代的武林世界,黑暗势力正在崛起;女主角叫灵儿,拥有操纵内力和飞行的力量。
接下来,是故事开篇。灵儿要击败黑暗势力,拯救武林。在小说的最高潮,她和反派进行了生死决战,击败了反派,拯救了武林和所有门派。
结尾,灵儿和盟友们还一起建立了内力修行所。
现在故事基本成型了,但有点简单,我想再增加一些角色需求:
【现在人物关系太简单了,只有两个角色,再增加4个角色】
文心一言又给出了四个角色,每个人都有不同的身份和性格,有着不同的人设,这个慕容孤城是一代宗师,还有一位能预测未来的先知萧寒雁。
但现在还缺一个小说中的必备要素,戏剧冲突。没有冲突的故事不是好故事,刚刚女主角打败黑暗势力的过程太简单了,我们看能不能加大点难度。
再来输入一个Prompt
【还要给故事增加主线的戏剧冲突,让故事更有可看性】
我们看,它已经写好戏剧冲突了。这里设置了一个反转,黑暗势力背后,真正的主导者是一位德高望重的宗师级人物,好几次让女主角陷入险境。直到决战,女主角才有了反杀的机会。
可以看到,它记住了故事主线是灵儿与黑暗势力的对决,冲突也是围绕这一主线展开。
那么,文心一言现在还记得刚写过的故事,并且把这些角色和故事对应上吗?
我们再来提个需求:
【把这些角色带入到你给我设计的故事大纲中吧,并且设计个标题。】
结果已经显示到大屏幕上,小说叫做《江湖风云之正义之战》,它把补充的人物和戏剧冲突加入到了故事大纲里。这里的第四章和第五章,它还告诉我们,这个反派的大宗师,就是刚刚介绍过的慕容孤城。
整个过程中,我不断加大难度、提出新的要求,去干扰它的记忆,文心一言依然记住了前面所有的需求和答案,能把故事情节和人物准确地对应上,记忆力非常惊人。
那我现在考考现场的大家,你们还记得,主人公灵儿的特殊能力是什么吗?
可能大部分人都不记得了,那我们看看文心一言还记得吗?
【女主角拥有的能力是什么?】
好,答案出来了,是操纵内力和飞行的力量。这就是在第一轮对话中,文心一言写下的示例文字。现在经过五轮对话和几千字的小说撰写之后,它还是能记得之前写过的内容,这就是大模型的记忆能力。
我们刚刚体验了大模型的四大能力,当然,大部分时候,这四项能力都不是单一出现的,是相辅相成的。
比如,创作一个广告文案,它需要理解创作主题、理清创作逻辑,通过记忆来保持前后一致。
在解题中,也需要综合应用理解、生成、逻辑、记忆能力。
我们再来看一个综合应用的案例:
首先,我们打开重构后的百度App,用摄像头扫一下患者拿出的药盒,就不用再翻看小字说明书了,还有数字人医生帮你讲解。
刚才屏幕上出现的问题,比如“是饭前吃还是饭后吃”、“喝酒能不能吃”,“还有什么注意事项”,是很多患者在日常用药中都会遇到的问题。
我们看到,大模型不仅可以帮患者做用药说明书的解读,还可以结合个性化的需求,提升用药效率,确保患者服药的准确性、及时性。
不久前,我们将文心大模型和专业的医疗知识结合,发布了灵医大模型,它的上层应用灵医Bot,就可以帮患者和医生对话、生成病历。这个例子不仅用到理解生成逻辑记忆能力,还用到了语音,视觉等多模态的能力。
前面的演示,主要体现出文心大模型在理解、生成、逻辑、记忆这四大能力上的进步,这些能力是一切AI原生应用赖以生存的基础。同样,没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。
我在五月份公开说,百度要做第一个把所有产品都进行重构的公司,我们要用AI思维,做出AI原生应用。
几个月过去,我们的搜索、如流、地图、网盘、文库等,都将以一个全新的面目,与大家见面。期间踩过不少的坑,也愿意跟大家分享,希望你们开发过程中能够少走歪路。
下面,我就给大家展示一下,这些用大模型重构的产品,究竟长啥样儿?这也是为了拓展大家的想象力,激发大家一起来做出更惊艳的AI原生应用来。
我首先向大家展示的是搜索,这也是百度的起点。很多人对搜索的印象是,你输入一个关键词,百度给你一个个网页链接。Not anymore!
百度新搜索,打开界面时,除了还能看到一个搜索框,搜索结果将和过去完全不同。
重构后的新搜索,有三个特点:极致满足、推荐激发、多轮交互。
什么是极致满足?当你在搜索框里输入问题,比如“MBTI是什么?”“怎么侧方停车”,新搜索不再是给你一堆链接,而是通过大模型去理解,生成一个最好的答案
比如,询问“过去20年各国工业增加值排名”,新搜索不仅会直接告诉你答案,还能用动态的图表来展现答案。
从我身后的大屏幕可以看到,过去二十年,我们的工业制造业经历了飞速的发展,正从制造大国向着制造强国转变。
这就是极致满足:一步给你最极致的答案。
那么第二步,看到答案后,你还想看到哪些内容?
这里就用到了推荐激发。比如在动态图之后,推荐激发功能还给出了“工业增加值与GDP有什么关系” “工业对国民经济发展有何影响”这些你还可能关心的问题。点击就能得到答案。
当然,并非所有需求都有一个唯一正确的答案。用户的需求有时候会很复杂,一句两句话说不清楚。用户也很难把一个非常复杂的需求,一次性地通过大段大段的描述完整表述出来。
这时候,我们就需要用一个更新颖、更个性化的搜索模式来服务用户,这就是:多轮交互。
我们来看一下这个例子:
比如,你询问“北京周边登山去哪儿比较推荐”,它给出了百花山、海坨山等多个答案,偏向徒步路线;
然后,它给出几个提示,让你补充选择自己的情况,你可以选择新手、亲子和观赏落叶几种情况。现在,它改为推荐西山和百望山,相对好爬,而且对亲子活动比较友好。
那再继续询问,登山徒步需要什么装备?回答有登山杖、登山鞋等,而且它还记得前面选择了亲子游,特别提示了怎么照顾小朋友。
可以说,生成式AI与搜索是天作之合。
搜索,虽然还是从那个简单的框开始,但接下来的一步步,都已超越、重构了原来的搜索模式,不仅提升了搜索质量,而且突破了搜索的应用范围、扩大了产品边界。这样的
AI互动式搜索,将引领搜索行业的代际变革。
不久的将来,搜索会变成一个 贴心助手,能够随时唤起、解决问题,甚至打破“端”的限制,做到随时随地响应、满足所需,全程陪伴。
下面,我们来看看第二个AI原生思维产品,百度GBI,Generative Business Intelligence,也就是生成式商业智能。
这是一个从零开始的产品,不是对已有产品的重构。
在我们的商业世界里,最离不开的就是商业分析,也就是BI,怎么做出最快的商业决策?先让大家通过一个视频,感受一下:
大家看到,在视频里,总裁问了多方面的专业问题。有财务分析的、项目交付的,还有用户分析的,运用了GBI的总裁助理,都能快速给出结果,让总裁当场决策。
这就是基于大模型能力的决策利器,国内首个生成式商业智能产品,百度GBI。用GBI,干啥都快!
掌握先进工具的人不仅不会被AI取代,而且“升职加薪不是梦”。不使用先进工具的人,才会有丢工作的风险。
那么,百度GBI是怎么做到快人一步的?它从三个方面颠覆了传统的数据分析:
首先,传统BI只有专业人士才能操作,而GBI能直接听懂总裁问题,实时执行;
其次,GBI提供了便捷的接入方式,企业可以接入数据,对任意数据用自然语言进行提问、分析,而不再需要人工去跨数据库、跨表格做各种专业操作;
第三,GBI还具备学习能力,企业可注入本行业专业知识,让它成为行业专家。
这就是百度GBI,它可以把商业分析师十几天才能完成的数据分析、撰写报告工作,缩短到分钟级。所谓天下武功,唯快不破;
企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了!
说到快速决策,在百度,我们依赖一个智能办公平台叫做如流,我们也利用AI重构了这个应用。
如今,它已经成为百度人离不开的超级助理。
现在大家请看,这是如流在做实时记录。我们来看看,它是不是能把刚刚讲过的要点内容都记住:
这就是如流的会议纪要一键生成功能。我们说,如何高效地开会,是个技术活儿。如流的这个功能,极大地减少了会议工作量,让开会时长缩短了40%。
另外一个常见的场景是工作群。大部分职场人常常被各种群聊信息轰炸。那么快速总结群聊的重点,就成了一个极为实用的功能。
下面请大家看看,我们如流的产品经理是如何使用它的。
他有9个工作群,耽搁一段时间,可能就有一千多条未读信息,而如流不仅可以“1000条消息,一秒get重点”,还可以智能地把需要阅读的内容分为:“待我确认”、“重点关注”、“话题讨论”几个类别,大大提高了工作效率。
那它究竟提炼得准不准,会不会理解有误,或者漏掉关键信息?这考验的就是大模型的理解和生成能力。理解越深刻,总结越精确。不要说1000条,1万条信息,如流超级助理也一样可以在几秒钟内,就给出智能分类、智能总结。
我们再看看工作中的另一个场景:差旅。
机票、酒店、谈参等等,这些事务性的工作很繁琐、也很耗时!如果人手一个AI助理,帮你解决琐碎事儿,你会不会更爱工作?
比如,最近如流的产品经理就计划出差去上海,和人保的王总见面。我们知道,人保集团正在推动产品服务、商业模式、数字科技等方面的创新,我们百度的人工智能技术正好可以发挥作用。
这次出差行程安排,就可以交给如流这个超级助理,我们一起来看看它的表现。
超级助理可以根据他的日程信息来安排行程。
像最晚的会议是4点结束,所以预定7点半之后的飞机;以及,按照他的差旅标准,帮他找到可以住宿的酒店。最后,还发出了和客户的会邀。
和客户见面前,他可能需要一些合作背景,这点如流的超级助理也可以帮他完成。通过和CRM等公司系统数据打通,如流给出了合作项目、拜访记录等细节数据。
通过理解业务合作情况和外部信息,如流还能帮他生成一份谈参,预设客户可能提出的问题,还会给出一些合作建议。从这点看,如流是不是更像一个真实的助理了?
我们刚刚看到,只说三句话,如流就搞定了差旅单、机酒和日程的预订,甚至还准备了洽谈的参考资料,这就是如流的“一键差旅”。它是怎么做到的呢?
这是大模型的理解、生成、逻辑、记忆能力的综合应用,它自动地把复杂任务,拆解成多个简单任务分别执行,再合并生成最终的结果。我们说,提升效率,就是提升竞争力,如流让“智能工作”代替“勤奋工作”。
现在,我们再来看看新的百度文库。这也是我认为目前重构最彻底的一款产品。
百度文库将会彻底颠覆我们的办公、学习和创作的习惯。
过去,我们是怎样创作的?举个例子,假设你要做一场演讲,主题是AI在心理学领域的应用。查资料、整理素材、写稿、写PPT、美化PPT,得花上好几天时间。
今天,在百度文库上,你可以用一句话启动工作,请看大屏幕:首先,你希望它能撰写一篇演讲稿,围绕人工智能和心理学这个主题,它找到了几十份资料。
还能识别出哪些是学术期刊、权威报告,哪些只是大众材料。如果你想写一篇生动活泼的文章,就去选一些大众素材,比如散文、科普类的。
那如果你想要一篇严谨的学术演讲稿,就可以只勾选权威内容,保证内容的准确。然后,文库通过理解这些文稿资料,再生成一篇结构完整、段落清晰的文章,同时对内容做出润色和排版。
能做到这些,是因为百度文库已经拥有了10亿优质文档,基于对这些内容的理解,写出真正实用、清晰的文稿,而不是像很多大模型一样一本正经地胡说八道,也不会是泛泛的空谈。
下一步,演讲还需要PPT。文库可以把刚刚这篇稿子和你收藏过的一些资料结合,自动生成PPT的框架,然后美化作图,做出一个几十页的PPT。
这里还有一些多模态生成能力的玩法,比如风格选择、风格一键切换。但还有一些更考验文库能力的地方,需要它对内容有精准的理解。比如,它要知道观点之间的关系,是并列,还是从属,才能设计出正确的图表。
因为有这样的理解能力,所以文库在生成PPT基础上,还可以为这份PPT写好对应的演讲稿。不仅如此,它还能根据这些内容,推演出观众可能会提出的问题,为你准备好回答。
我们评测过,文库这些生成能力,尤其是PPT的生成能力,已经远超市场上任何其他工具,不论国外还是国内。过去,人们来文库是为了找现成的内容。今后,人们可以随心所欲地来文库生产内容,效率高于任何其他生产力工具。
基于文心大模型的四大能力,不夸张地说,百度文库是从根本上革了自己的命,完成了从“内容工具”向“生产力工具”的进化。
不久前,百度文库新版本开放首日,AI新功能就迎来超过200万人次体验。现在,我们更加有信心说,大模型时代,百度文库是生产内容最好的起点。
和文库一样,百度网盘也是大家熟悉的老朋友了。过去11年,百度网盘为8亿用户服务,文件量级已经达到了4万亿,每一天用户会上传超过10亿张图片。
百度网盘在AI重构的方向上,重点就是做好个人文件的智能服务。
大家现在看到的,就是百度网盘的新首页。
重构后的网盘,不但实现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。
现在,只需要一句话,你就能对自己网盘内的文件、图片、视频等进行操作。
这就是百度网盘“云一朵”,它是业界乃至全球首个个人云智能助理。下面就让我们感受一下,“云一朵”能解决哪些痛点,带来新体验?
第一点就是找图片或找视频。有时候,我们想起来一个画面,想在网盘中找到它,往往要经过很多步操作,折腾半天也找不到。现在,你对“云一朵”说一句话,它就能帮你精准定位:
好,它帮我快速找到了OpenAI首席科学家llya采访中,关于transformer的内容。
在这次看似简单的搜索背后,是多个AI能力的作用,它要能理解视频内容、识别角色、还要形成上下文的记忆,才能精准定位到视频的某一帧,这个技术在全球个人云领域都是非常领先的。
云一朵的第二个特点,是帮助用户快速了解视频的内容,我们来看一下:
大家看到演示了两个能力,一个是对内容进行总结和摘要的能力,还有提取金句的能力。这是一段43分钟的采访,通过AI的理解和逻辑能力,云一朵对视频做了总结和提炼,介绍了llya和他的主要观点。
但是很多时候,我们会觉得原文很精彩,提炼出主要观点或者摘要后,就没有那么吸引人了,所以刚才的第二个功能,我觉得其实对我来说更有用,也就是说我们要找到原来视频当中最精彩的部分,就是那些金句。比如llya说“学习统计规律比看到表象要重要得多”。能提炼出这个金句,这其中的关键突破是,实现了多模态信息的高效提取,这个技术在全球都是领先的。它能够从很长的访谈内容中找到最精华的部分,极大地提高了我们的学习和工作效率。
这就是AI重构后的新网盘。截至昨天,云一朵用户已经达到2000万。
它是基于个人云的AI智能助理。过去十年,百度定义了什么叫网盘;未来十年,百度将用AI重新定义新的网盘。
接下来,我们来看一个更为历史悠久的产品,百度地图。
我们用AI原生的思维重构了这个18年历史的产品,这也是全球首个AI原生地图产品。
在过去的18年中,百度地图积累了非常丰富的功能,它可以导航、打车、找代驾,还能订酒店、买机票,甚至满足更为复杂条件下的POI查找需求。过去,这些操作复杂,往往需要六七步甚至更多才能完成;
现在,用户只要说出需求,地图就能调动几千个服务的API接口,多级菜单变成一步直达,快速响应。
我们接下来看看,百度地图是怎么实现的?
视频里,用户考验了百度地图对泛需求的理解,中间聚会点的选取、多地点的信息对比,以及未来出行的推荐和预约,它都给出了合理方案。
这是因为文心一言的能力,已经与地图特有的亿级POI知识和万亿级交通感知数据进行了融合,能随时调用,给出推荐。重构后的百度地图,不只是导航,更是我们的出行向导。越用越聪明,越来越懂你。
刚刚,我们展示了6个线上的AI原生应用,但大模型带来的改变不仅如此,它也在影响着我们线下的工作和生活。
比如,用大模型重构的汽车车内空间,是否会给我们带来惊喜?来看一段本月底即将交付的集度极越的视频。
当大模型与智能座舱相结合,你与它交互得越多,它就越能理解你的需求。不再需要复杂的按键操作,用语音就能操控车内的一切,让智能座舱拥有逻辑推理、策略规划和内容生成等各种能力。
即使在七嘴八舌、多人指令、声音交织、连续对话的情况下,它也能理解每个人不同的需求,同时满足。
这些能力已率先落地在由集度设计的极越01汽车机器人上,百度Apollo将在EQ、IQ两方面全面赋能这款新车,极越01也将成为最聪明、最懂你的汽车机器人。
今天,相信大家已经感受到了AI的巨大能量,我更相信,大模型将开启一个繁荣的AI原生应用生态。
谈到生态,不能不提插件,它非常重要,能让开发者、创业者快速加入到生态中。
插件是一种特殊的AI原生应用,也是门槛最低,最容易上手的AI原生应用。不久前,百度上线了灵境插件平台,无论是个人或者企业的数据、能力还是应用,都能在灵境平台上,快速变成插件。
举个例子,你从网上买了个东西,卖家发货与实物不符,咨询怎么要求赔偿?
这里,法律智能助手就可以给出建议,因为它接入了中国司法大数据研究院这种官方权威机构提供的插件。
再比如,毕业求职季,简历很重要。你想做一名AI算法工程师。
没问题,看一下,只要输入包含背景信息的Prompt,大模型通过调用插件,就能帮你一键生成简历模板。
插件增强了大模型的能力,让它更实用、更易用,也使得很多企业私有数据在没有泄露风险的情况下,能方便快捷地利用到大模型的能力,更能降低开发者的门槛,促进AI生态的繁荣。
现在,灵境插件平台,上线短短一个月,已经有2.7万开发者申请入驻,覆盖20多个领域,除了法律咨询、简历生成外,还有脑图制作、口语练习等各种各样的场景。
AI原生应用调用基础大模型的主要方式是API。在百度的千帆大模型平台上,企业可以快速调取包括文心一言在内的各种大模型的API,获得大模型的能力。
现在,千帆大模型平台已经成为了中国最大、最开放的大模型开发平台,不仅有42个主流大模型入驻,而且有17000家企业在这里开发产业模型和解决方案,覆盖了各行各业的近500个场景。
从今天起,企业客户可以通过千帆来申请测试文心4.0的API了。中国有丰富的应用场景,中国用户又天然愿意拥抱新技术,有了先进的基础大模型,我们就能构建起一个繁荣的AI生态,共同创造新一轮经济增长。
随着这一波AI浪潮的到来,也有些人会担心会不会被AI所取代。但我们首先看到的实际情况是——AI不仅不会替代人,AI还能救人。
10秒钟完成预警,10分钟完成救援,哪怕是在瞬息万变的现实里,AI也能依据风险排查的逻辑,通过对复杂图像、语言的理解,第一时间找到潜在风险点,发出预警,避免悲剧发生。
最后,我还想说,未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界。自动驾驶就是视觉大模型重构物理世界的一个典型应用。
大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖。
下面就请我的同事震宇带大家感受一下,请看大屏幕。
今天,百度自动驾驶出行服务平台萝卜快跑,已经是全球最大的自动驾驶出行服务商,累计提供了超过400万次载客服务。萝卜快跑的全无人车,已经跑在武汉、重庆、北京、上海、深圳等城市的很多个区域。
我相信,随着运营规模的不断扩大、技术水平的不断提升,成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化盈利。
让我们共同期待,AI原生出行时代的到来。
随着大模型技术不断提升,我坚信,从今往后,大量AI原生应用将不断涌现,数字技术与实体经济将深度融合。
我们的大模型技术已应用在制造、能源、电力、化工、交通等实体产业中。
用智能巡检降低安全隐患、用智能调度缩短交付周期、用智能决策提升企业效率、用智能信控解决交通拥堵…大模型正成为新型工业化的重要推动力。
时代周刊在一期封面文章中写道:
“AI的独特性…是它不仅能模仿人类的某些技能,还能执行我们难以完成的任务。然而,推动机器学习和大语言模型每一次进步的背后,其实都是人类。”
对这句话,我非常赞同。
新的世界、新的未来,将在每个企业、每个开发者、每位用户的一次次Prompt中生成。
我们即将进入一个AI原生的时代,进入一个人机通过prompt来交互的时代,未来将由你生成!未来由我们一起生成!谢谢大家!
✅ 我们推出了AIGC产业大课,目前第4期AIGC大课正在招募中(点击下方报名)
✅ 我们也在开展“AI创新大赛”,评选出2023人工智能ToP10(点击下方报名)