百度集团副总裁、小度科技CEO李莹
随着苹果公司、小米等公司开发和升级自己的AI大模型技术,AI大模型技术已在成为智能硬件领域的关键趋势。
近日,百度集团副总裁、小度科技CEO李莹在接受南都记者采访时表示,以“AI+硬件”为战略定位的小度科技,已经发布了基于文心大模型的AI原生操作系统DuerOS X,并在有屏设备的多个产品中实现了应用。
AI大模型抢滩登陆智能硬件。7月底苹果公司发布了苹果智能的首个iPhone AI版本。新软件目前只在iOS 18.1的开发者测试版中发布,功能主要围绕写作工具、Siri、相册等方面,此次更新尚未集成ChatGPT功能,苹果称该功能以及更多更新将在明年正式上线。同日小米官方发文称,小爱同学“大模型小爱”应用正全量升级,覆盖手机、平板、电视、音箱、汽车等核心品类,支持自然问答、图片编辑、车外唤醒防御等功能。
早在今年4月16日,小度发布基于文心大模型的首个AI原生操作系统DuerOS X,目前已在添添AI平板机器人、小度学习机Z30、添添闺蜜机、小度智能屏X9 Pro等产品中实现大模型“换脑”。
“AI原生操作系统DuerOS X相当于给小度换上了新‘脑子’,不仅更精准理解用户的语音,还能理解用户的手势、表情输入。”小度科技CEO李莹近日接受南都记者采访时称,早在今年初小度所有的有屏设备都升级了带有大模型技术的语音聊天功能,升级后的小度多轮对话能力大幅增强,以7月份的最新数据来看,聊天交互次数提升了7倍。李莹表示,小度的战略定位是“AI+硬件”,接下来会用AI重新定义智能音箱/智能屏、智能教育产品,同时会深耕智慧养老、智慧酒店等行业应用。
“小朋友是跟小度‘聊天’最多的群体”
南方都市报(以下简称“南都”):换上新的“大脑”,即DuerOS X操作系统后,小度在体验上有哪些显著的提升?
百度集团副总裁、小度科技CEO李莹(以下简称“李莹”):以添添AI平板机器人为例,它是小度基于文心大模型换脑后,首款搭载DuerOS X的智能硬件产品。添添AI平板机器人在多轮和复杂的智能语音交互层面,有明显的智能提升。区别于传统的智能音箱,只能接收单一的语音指令,播放、暂停、调节音量等等。现在则可以听懂用户口语化的表达,同时对上下文的理解能力也更好,小度还会主动发起追问,实现多轮的智能交互。
从后台看,每天跟小度“聊天”最多的群体之一,就是小朋友。比如他们会问:在幼儿园同学不跟我玩怎么办?小度会建议他可以多跟同学分享零食、玩具,给大家一些彼此熟悉的时间。如果小朋友继续问这种情况是不是应该告诉自己的父母?小度还会安抚他的情绪,并建议他如果能使心里舒服些,就可以跟父母沟通。应用大模型后,小度的聊天对话轮数显著提升。
另外,小度可以灵活调用多种Agent也就是智能体,来完成复杂任务。有一个很形象的比喻,就是小度现在不是一个人在为你服务,而是背后站着一群“人”,用户需要哪位专家,就请哪位出来,如法律专家、旅行专家、健康顾问、星座达人等等。
此外我们还规划了“全息视界”的能力。它可以陪你玩石头剪刀布、根据天气给你穿衣建议、能进行食品健康分析等等,比如拍一下药瓶,就能告诉你药品作用和服用说明。大模型让我们的“大脑”能够模拟类人的情感,与用户共情、发展长期的共同记忆,从而真正地提供陪伴感。这些都将随着技术迭代,陆续应用到小度的全系产品中。
南都:如何解决交互量提升带来的成本上涨问题?
李莹:小度用的是moe架构,即模型路由的架构,从效果到性能成本,到速度都是充分考虑的。我们有最小的模型tiny,复杂的问题也会去问最强模型ERNIE4,中间还有character,以及speed,等等。模型路由架构的好处是,第一我不同的需求可以选择更适合它的模型,第二就是解决成本问题。
当然成本肯定有一定提升,我们会在硬件里把成本考虑进去的。我们采用AI+硬件+场景模式,在不同的硬件上配置不一样的模型能力,因此一些新设备整体配置是最高的,有更丰富的模型能力。原有设备的升级部分,是直接提供给用户的,相当于把大模型的能力更普惠地释放给了用户。
南都:DuerOS X发布会后,小度陆续推出了添添AI平板机器人、新款小度学习机。为什么优先落地教育?
李莹:大模型在教育行业应用受到了极大的关注,这也是我们认为大模型最有价值的落地应用场景之一。
传统的学习机产品,普遍是按照学科维度,尽可能多地汇集各类学习内容、资源及工具。随着AI技术的加入,很多高端学习机产品几乎都落地了诸如精准学、作文指导、口语练习、互动阅读等各种AI功能,从刷题、改作业到素质教育,一应俱全。但孩子依然不愿意学,或者学不进去怎么办?
我们的做法是重新定义了“AI老师”功能,基于文心知识增强的大模型,AI老师同时掌握通用知识和专业知识;同时,在古诗词预习场景中,我们会通过大模型来生成沉浸式的画面,配合古人声情并茂的讲解,营造出“身临其境”的学习场景,无形中加强了孩子对课文的记忆和理解。以及在视频课播放过程中,孩子都可以随时打断并提问,AI老师随时解答。
再比如,在课后练习场景中,针对错题讲解,AI老师不会直接告知答案,而是一步步地启发、纠正、鼓励,让孩子自己学到解决问题的方式、方法。
跟大家分享一些数据:根据2024年Q2的数据统计,小度学习机累计用户数超过200万,其中每日活跃的使用用户达到一半以上,这些用户每天的使用时长超过100分钟,其中,小度AI学习功能每天使用率高达97%。
DuerOS X产品架构。
“接下来重点布局酒店、养老、全屋智能”
南都:目前DeurOS 在行业侧有哪些应用?
李莹:小度自主品牌设备目前有4600万,而通过第三方生态覆盖的设备有7亿,搭载DuerOS智能设备单月语音交互次数超71亿次,这些都是行业端的应用,包括智慧养老、智慧酒店、智能汽车、智能家电、智能穿戴等行业,我们通过输出小度AI智能助手能力或者完整解决方案,对各行业完成大模型赋能。
在消费电子行业,我们与华为、荣耀、OPPO、Vivo、小天才等头部品牌达成深度合作,累计赋能超过1.3亿台设备。在酒店/地产行业,小度目前已经覆盖130万间酒店客房数,包括华住、锦江、洲际、首旅如家、亚朵等10余家国内外知名酒店集团,以及世茂洲际、The Chedi安岚酒店等高端酒店品牌,在行业里处于绝对头部地位;养老行业,小度携手行业伙伴共建智慧养老产业生态,在家庭场景中的老年用户高达40%以上,小度用户平均每天使用时常3小时以上。此外我们的IOT全屋智能遍布了全国400个城市,累计服务了超3亿人次。
南都:接下来会重点布局哪些行业?
李莹:接下来我们最重点布局的行业包括酒店、养老、全屋智能。当然车和家居设备也是重点。首先这些是我们有积累的行业,同时大模型到来之后也会给行业带来变化。
一个典型的案例是最近china travel特别火,很多来中国旅行的海外游客,在社交平台上发布他们入住酒店的视频,被小度的英文智能对话震惊到了。这些是大模型技术升级给小度带来的能力提升,让我们可以快速高效地在产品上增加一个新的语种。
“从3个方面重构大模型的‘用处’”
南都:接任小度CEO后设立了哪些具体的目标?
李莹:小度的战略定位一直是“AI+硬件”。我接手以来,看到了大模型的技术变革黑“AI+硬件”带来的机遇,我的目标就是,通过大模型技术,要把硬件产品进行重新定义。
我认为AI助手是大模型时代入口级的战略机遇,我们必须抓住这个机遇,构建小度在大模型时代的核心竞争力,深挖大模型的“有用”之处。主要包含3个方面的重构:
一是AI助手能力的重构:DuerOS能力与生态构建,要持续积累大模型能力,强化AI原生操作系统的构建,通过多模态感知、自然语言交互,打造更丰富和强大的智能体生态,正如Robin所说,智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。
其次,C端用AI重新定义硬件:我要继续巩固智能设备在家庭场景下的优势,用AI重新定义智能音箱/智能屏、智能教育产品,带来更大的产品体验的飞跃,探索硬件产品“智商和情商”的持续进化,突破大模型能力边界;同时,积极开辟用户入口级的设备,它有可能是全新的赛道。第三,B端赋能更多行业领域,智能汽车、智慧养老、智慧酒店、智能家居、医疗健康等等,携手行业合作伙伴,拓展生态全景。
南都:如何看待AI原生操作系统在未来智能设备市场中的发展趋势?
李莹:大模型正在成为AI原生时代操作系统的新内核。大模型作为核心引擎,在操作系统内核中不能缺位。除了各种大模型以外,操作系统还需要具备构建强大的大模型服务能力,提供模型调用、评估、部署等工具链。
至于说未来在智能设备市场中的发展趋势,首先是AI原生操作系统与AI技术的进一步深度融合。一方面,这一融合将使得智能设备在处理复杂任务、理解用户需求方面表现出更高的智能化水平。另一方面,AI原生操作系统将不断引入新的技术创新,如多模态交互、自然语言处理、强化学习等,以提升系统的智能化程度和用户体验。这些技术创新将推动智能设备向更加智能、更加人性化的方向发展。
其次是整个智能硬件市场,随着消费者对智能家居、可穿戴设备等智能产品的需求日益增长,AI原生操作系统将成为这些设备提升用户体验、增强竞争力的关键要素。未来,AI原生操作系统将在更多类型的智能设备中得到应用,从手机、平板到智能家居、智慧城市等各个领域,市场需求将持续增长。
采写:南都记者 马宁宁