当前位置:首页|资讯|生成式AI

探境科技:迎接生成式AI浪潮 离线NLP方案先立后破

作者:爱集微APP发布时间:2024-01-31

原标题:探境科技:迎接生成式AI浪潮 离线NLP方案先立后破

“凡战者,以奇胜,以正合”,兵家如此,其他领域其实也莫不如此。

在AI芯片已成为数字经济时代的核心驱动力之下,智能家居业也与日渐进化的AI碰撞出新的火花,助力在人机交互时自然语音理解等技术领域的突破,推动行业进入全新的“真智能”时代。

面向“真智能”需求,打破以往传统语音AI模型运行在云端的桎梏,释放“即插即用”的应用潜力成为行业共识。

为此,北京探境科技有限公司(简称探境科技)独辟蹊径,持续开发和迭代端侧离线AI语音芯片方案,无需繁琐的配网和触控操作,一句指令就能让空调、风扇、灯具等智能家居“随声而动”,不仅开启了AI“赋智”端侧应用的全新可能性,也让探境科技站在了离线AI语音芯片的前沿。

离线NLP方案迎来窗口期

回顾过往,不得不说智能家居等端侧场景的智能化走了很多弯路,一众产业链厂商路径依赖在Wi-Fi/蓝牙、大屏、APP等软硬件元素上相互“内卷”,但实际效果却显得差强人意。

正如探境科技所指,此前语音识别功能主要集成在智能音箱中,其AI模型运行在云端,依赖网络连接为端侧提供语音识别功能,这一方式带来三大问题:一是用户需要配网,否则无法使用语音识别;二是网络连接稳定性影响使用体验;三是安全成为最关键的问题,用户担忧其个人隐私泄露。

解决之道可谓“先立后破”:离线AI语音识别完全避免了以上问题,并可将关注点放在解决用户高频使用的场景上,提供无须联网就能本地运行的AI语音识别能力,堪比端侧场景智能化的“第一性原理”。

“第一性原理”即采用批判性思维和怀疑精神挑战人们的固有认知,拨开事物的表象回归到事物的本质,然后围绕这个本质去考虑解决方案。

探境科技也据此道出了深刻的洞察:“离线AI语音识别意味着用户如同使用水/电/天然气一样,实现即插即用、高稳定性且无须顾虑隐私问题。因此我们认为离线语音识别将成为当前到未来的明星功能,形成庞大稳定的细分市场。”

但知易行难,自然语义处理(NLP)虽具备强大的性能和良好的交互体验,但由于其模型复杂、实施工作繁杂,至今市场上还鲜有离线方案。

探境科技认为,实现离线NLP需要打造从芯片、算法、软件及增强语音处理的全套方案,才能解锁端侧智能,提升用户体验,为未来成为智能设备、智能家电等产品的默认配套功能铺路。

这一条分缕析也着眼于需求侧的诉求。由于智能家居市场进入存量“内卷”的平台期,使得供应商在同质化价格战中“蒙头狂奔”之外,有更强的紧迫感要“抬头看路”,审视现有主流技术方案的价值点,以寻找差异化的产品卖点和业务增长点,从而为离线NLP的积极尝试打开了机遇窗口。

据statista发布的报告预测,全球智能家居市场规模预计将从2022年的1261亿美元增长到2026年的2078亿美元。预计到2026年,国内智能家居市场规模有望达453亿美元。近期随着ChatGPT、文心一言等模型应用的成熟,推动行业智能化产品技术创新加速发展,促进行业进入新一轮成长周期。探境科技指出,离线智能语音的市场拐点已经到来,我们正在迎来需求大潮。

软硬兼施加快端侧离线部署

基于市场对端侧语音市场“真智能”的渴求,探境科技双管齐下,着力打造可商用的全栈解决方案。在硬件层面,探境科技以独有的SFA(存储优先)架构NPU来打破存储墙壁垒,适应AI计算“高差异、高并发、高耦合”特性。

随着生成式AI的热潮席卷了全球,市场迎来了“生成式 AI 元年”。探境科技也谋定而后动,在前几代语音芯片成功的基石上,创新推出了新一代芯片VOI811,采用了ChatGPT同源的Transformer模型,支持更高级的NLP功能,较以往的LSTM模型相比,大幅改善了模型对算力资源的使用效率。基于Transformer模型,搭载VOI811的设备无需用户记忆特定关键词,其自然叙述的控制意图即可被准确理解。

除在硬件层面持续迭代之外,在算法层面探境科技更以NLP算法模型为核心,精准卡位,配套开发了先进软件功能和其它增强算法发挥合力。

对此探境科技详细介绍道,这主要涉及一是声源定位,即可对语音命令的来源方向进行定位,依赖此技术可实现丰富的应用场景。二是声纹识别,可对语音主人身份进行识别,并依据识别结果提供差异化服务,如个人喜好设定,儿童锁等。三是就近唤醒, 对于全屋智能场景中多节点的情况,实现就近节点响应和互动,提高使用体验。四是增强语音处理,应用创新的科研成果,对有用声源和各种噪声进行增强处理,从而提高后端语音识别的准确性和稳定性。

“软硬兼施”之后,为解决客户的快速定制开发需求,探境科技还更进一步开发了NLP自然语义AI开发平台。据介绍,这一平台具有多重优势,包括全面覆盖智能家电产品、全品类控制功能意图、快速生成AI模型和快捷Design In等。同时,探境科技正在持续优化云交付平台的功能,力求为众多客户提供更佳的使用体验和更快捷的开发能力。

众所周知,应用Transformer的大型语言模型LLM训练推理,动辄需要上万颗高性能GPU支撑,要在端侧实现同源的算法架构绝非易事。而探境科技凭借在AI芯片和算法的全面加持和软硬件全栈技术能力,打通了离线AI语音识别的“任督二脉”,在市场上也收获了广泛的认可。相继有多个国际一线大厂和国内头部厂商合作将探境科技NLP方案立项植入其智能产品,累计出货量目前已达到千万量级,覆盖品类广泛,开创了在端侧大规模部署离线AI语音识别的“先河”。

这或是“不自见,故明;不自是,故彰;不自伐,故有功;不自矜,故长”的另一精彩诠释。

未来全面押注持续精进

如今的生成式AI在各种话语体系营造声浪之际,权力和资本已然入场,构筑了大戏的框架,端侧NLP也将迎来新的“使命”。

探境科技指出,随着离线语音市场的拐点到来,将加速普及,探境科技也着力从战略和战术层面做好规划和布局。

未来,探境科技将始终坚持离线语音控制这一端侧设备交互技术路线,进一步完善其不同层次市场需求的产品线布局,涉及高性能大算力多功能的高端芯片、低功耗芯片、极致性价比的主流芯片。此外,还将采用多种封装形式,满足高中低端市场的多样需求,包括QFN/SOP/BGA/CSP等。

除在芯片层面的“组合拳”大开大阖之外,在算法层面,探境科技也将持续精进。探境科技表示,将持续解决各类智能场景中的痛点需求,如解决室内移动过程中的就近唤醒功能、声纹识别功能、语音自定义功能、Oneshot功能等。

值得一提的是,探境科技还将为客户着力提供增值服务如DOA声源定位、增强语音处理等。对于这一考量,探境科技表示,都是来自于客户的真实需求,解决了现实场景存在的各种痛点。

这也让笔者想起法国作家安东尼.德.圣艾修的描述:“如果你想建造一艘船,那么不要把人民都聚集到一起,收集木材,下订单和分配工作,而是应该引导他们向往浩瀚的大海。”

无疑,离线NLP就是浩瀚的大海,探境科技在不断添加“燃料”加速航行之际,也将让智能家居用户更多感受到梦想照进现实的惊艳,体会到生成式AI近在咫尺的美好。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1