引领产业发展,助力中国创新
《创新在中国》系列活动由北京金融科技研究院联合北京清芬新金融研究院主办,旨在打造一个让更多优秀的中国创新企业充分展示的平台,获得业务发展的机会、加强行业交流,形成更有利于对行业和产业发展的支持政策与有效监督。“《创新在中国》之走近专精特新企业”专题系列对话活动即将启动,此系列将聚焦专精特新企业发展问题,持续开展多元对话,活动将采用专题讲座、圆桌对话、会议讨论等丰富形式,为企业提供良好的展示舞台和交流平台。
本期嘉宾
陈孝良
北京声智科技有限公司
创始人、董事长
北京声智科技有限公司是一家融合声学和人工智能技术的平台服务商,主要提供SoundAI Azero智能操作系统和服务,以及深度结合应用场景的人工智能技术和产品解决方案。声智科技基于自主研发的Azero人工智能开发框架,以声光感知和交互智能为特色,融合人工智能、大数据、云计算和物联网等技术,拥有多模态远场感知和多技能异构云脑等能力,构建“端边云”一体的IDA机器人和SDA数智人等标准,面向数字经济和生命健康等领域,提供基于Azero开发框架的产品、技能和服务,致力于推进人、机、物从物理世界到数字世界的互联互通、数字映射和交互决策,实现“让万物互联更智能”的使命,达成“用智慧科技改变生活”的愿景。
先导片一睹为快
↓↓↓
主持人:请您用通俗的话语介绍下声智科技都做了什么?
陈孝良
主持人:您能否给大家介绍一下Azero的开发框架是什么?
陈孝良
Azero开发框架类似于操作系统,它解决的核心问题是让碎片化的智能硬件快速具备数据采集和自主感知能力。在未来,我们需要真实世界的数据,而这些数据需要机器自己采集。针对每一个小功能智能设备,开发一个系统成本非常高,因此需要一个开发框架,让许多机器和合作伙伴快速具备自主感知数据的能力,以适应碎片化市场。该开发框架还要实现多模态感知能力,以满足不同场景的需求。在早期,许多智能家居和机器人都是基于Azero开发框架开发的产品。
主持人:您能不能用案例给大家科普一下,比如智能音箱背后如何用到这些开发框架?
陈孝良
Azero开发框架可以帮助合作伙伴快速实现智能产品的量产,并帮助其具备多种技能。例如,生产厂商可以使用开发框架将智能产品连接到互联网,实现数据采集和自主感知能力,而且只需三个月就可以实现量产,速度快的优势非常明显。此外,开发框架还帮助合作伙伴聚合了许多服务,使其在后端不需要做太多的工作,提高了生产效率。这是一种知识杠杆的作用,只要有一个产品学会了一项技能,就可以快速复制这些技术,具有每个技能的意识。这使得许多产品生产商和合作伙伴可以快速打造自己的品牌,并实现差异化,推出具有智能特性的产品。这些产品可以应用在许多碎片化的市场中,实现延伸差异化,比如除了播放歌曲和讲故事之外,还可以控制电梯、垃圾箱等功能。
主持人:请您给大家介绍一下BlenderBot?
陈孝良
BlenderBot旨在解决语言差异并赋予聊天机器人一些拟人化特性。我们通过数据汇集让机器人具备有趣的能力。与ChatGPT不同,我们需要跟进小模型路线。机器人经过专门训练,理解特定场景并分配任务到每个小模型中处理。非常重要的是做到足够全面,但不至于过度准备数据。对于缺失的数据,我们需要做一些生成的话术来解决问题。
主持人:像BlenderBot解决的更多是底层NLP语言,不是ChatGPT大模型,它不解决场景具体的知识问题,解决的是什么?
陈孝良
刚才提到的解决具体场景的是Cimon。Cimon是一个小模型,用于实现多轮交互。它的功能是深入探讨特定领域的知识和提供相关服务。很多场景的应用都需要多次交互,以满足真实需求。Cimon主要解决的问题是机器人需要具备多轮交互的能力。例如,控制电梯需要多次指令,同时需要考虑安全因素。Cimon解决垂直场景中小模型的问题,BlenderBot解决模型的分发问题。BlenderBot和Cimon可以结合起来训练大型模型,但这需要大量数据和多方面的支持,是一个独立的问题。例如,BlenderBot解决图书馆目录、索引、分类和搜索等问题,而Cimon解决具体的小模型研究。包括像垃圾分类,它要做决策、提供服务,它要解决这些事情,这个是BlenderBot和Cimon不太一样的地方,最好是两者组合训练,组合在一起才能解决问题,采集、分析、交互、决策,本身就是一个数据的闭环。
主持人:能否介绍一下冬奥声智科技的支持案例?
陈孝良
主持人:现在银行、保险的很多电话都是机器人打的,这个领域声智是不是也做了一些工作?
陈孝良
主持人:人和人之间声纹的区分度跟指纹的区分度接近吗?
陈孝良
每个生物特征都是独一无二的。声音有一个优势,即实时信号和可长时间捕获特征。因此,在测谎、电话营销和反欺诈领域中,我们经常使用声音技术。此外,聊天机器人的记忆和交流方式也是通过声音实现的。
主持人:之前我理解拟人化和声音模拟是两种技术,这两种技术都在应用中得到了体现?
陈孝良
是的,实际上原来两个技术相对来说比较独立,一个是偏语言一点,一个是语音合成。目前拟人化和声音合成技术已经相互融合,不再是单独的技术。
主持人:声智科技是不是除了做软件自己也做硬件?
陈孝良
声智科技的核心定位是提供底层的框架系统,以软件为算法,以数据为核心,需要与合作伙伴在重要的产品中验证底层系统的能力。硬件主要用于示范,在产品中展示声智科技的作用。
主持人:除了保障冬奥,在智慧城市其他领域是不是还有应用?
陈孝良
比较典型的是像环球影城综合性服务,包括在故宫里面的典型应用。现在在涉足文旅行业特,特别是对文旅数字化的需求。我们要帮项目堆齐流量,同时交互中要求高效率,延迟极短,支持大人流、大客流。这些都基于数据实现,前提是先有数据。
主持人:您刚才提到环球影城也是咱们的客户,环球影城和冬奥哪个更难?
陈孝良
冬奥和环球影城项目有所不同。冬奥是临时性的,需要在短时间内准备应对巨大的压力,需要快速抗压的能力。环球影城需要持续性的能力,考验的是系统的可靠性和可信性,需要在长期的运营中解决各种问题。
主持人:您认为声智科技的潜在客户有哪些?
陈孝良
我认为我们有三类合作伙伴:
1)硬件生产厂商,可以合作提供软件能力、算法能力和落地支持;
2)垂直场景应用和服务厂商,可以解决场景的痛点,如健康、心理咨询等领域;
3)基层大型厂商,可以提供定制化解决方案,帮助解决供应链、交互和维护等问题。在数字化基础设施领域,我们提供生态型支持,降低成本加快速度,并解决可靠性和升级问题。
主持人:您认为政府能为专精特新企业做些什么?
陈孝良
一方面是我们国家力量,国内的一些科研院所、高校,另外一方面是企业力量。企业力量对专精特新来说完全靠企业自身的投入压力还是非常大的,需要采用联合实验室的方式。我认为政府可以出台一些政策支持联合实验室的模式。比如说对科研项目的企业分配,我们应该鼓励更多的企业机构参加学术科研,可以从其他的技术路线做出我们想象不到的贡献。
主持人:感谢陈董的精彩分享。