比AI更有价值的,是幕后的大脑
未来智能于5月15日举办2024讯飞耳机新品发布会,推出了iFLYBUDS Pro2、iFLYBUDS 2以及viaim Kit 2三款新品。这一系列新品将为用户带来更优质的会议体验和便捷的沟通解决方案,引领着AIGC行业发展的新趋势。作为搭载viaim AI的先驱AIGC耳机,未来智能为用户开启了智能硬件时代的崭新篇章。
发布会现场,科大讯飞联合创始人及未来智能董事长胡郁和资深媒体人杨澜一起见证了新品的发布,畅聊中国人工智能发展趋势。早在2016年,杨澜就制作过一系列人工智能纪录片,胡郁作为人工智能专家,是其栏目中的重要嘉宾。8年之后,未来智能的讯飞会议耳机,已经成为中国AIGC智能硬件的标志性产品。
相较于一年前发布的讯飞会议耳机Nano系列,讯飞会议耳机Pro 2升级了工艺,实现了闪录升级和语种扩充。更重要的是,如今讯飞会议耳机的“大脑”,会议助理viaim AI,从单向响应需求,成长为了能接受用户询问的聪慧个人助理。
和杨澜的对话中,胡郁如此形容讯飞会议耳机的蜕变:“你有了‘耳替’、部分的‘脑替’,在未来甚至是‘人替’。”
AIGC,走出互联网,进入物联网
时间已经来到AIGC劲风狂袭的第二年。“场景”,这个2023年下半年被AI应用厂商持续强调的词,找了更为合适的抓手:消费硬件。
“计算机的发展史,就是从算力从超算等大型设备一步步转移至个人电脑和手机等终端设备上的过程。”高通CEO克里斯蒂亚诺·阿蒙曾在采访中总结。
这一趋势在AIGC发展的历程再次上演——以软件为载体的AI应用所能触达场景有限,AIGC技术想要在用户的活动空间释放能力,依托于实体硬件,是必然的选择。
2023年,热钱和资源已经集中流向了AI大模型和软件应用。据不完全统计,“AI大模型五小虎”以不到1%的交易数,吞下了中国AI领域近40%的投资金额。
不少玩家已经试图在硬件中找到AIGC的新蓝海。在素有“消费电子春晚”之称的CES(国际消费电子展会)上,一名前大厂高管的新AI硬件项目在首发当天,就卖出一万台。另一家明星人型机器人企业带了7条机器狗去了展会现场,三天后,4条已经收到了来自马来西亚、美国等科技发烧友的订单。
数据也侧面印证了AIGC的新窗口,将在硬件赛道再次打开。IDC预测,2024年中国市场上搭载AI功能的终端设备将超70%,AI终端占比将达55%。
而此时,TWS耳机赛道,已经渴望一个新故事太久。
TWS,即真正无线(True Wireless Stereo),曾是耳机赛道最大的技术创新。自2016年苹果推出首代AirPods以来,TWS行业经历了四年的快速发展期。
但随之而来的,是在三年新冠大流行中不断收缩的市场需求,TWS耳机也迎来了行业的第一个瓶颈期。Canalys数据显示,2023年第三季度全球个人智能音频设备出货量同比下跌3%至1.1亿部。
市场环境是催化剂,TWS耳机行业发展阻滞的根本原因在于,L2HC、LDAC、aptX Lossless等新一代音频编解码技术,已经解决了从“能听”到“好听”的问题。但音频的技术已经触到了极致的天花板,TWS耳机已经很难从设计、外观和功能上,释放用户的新需求。
而AIGC技术的发展,让TWS耳机的应用价值从“听个响”,延伸到了“便携式的AI助理”。
未来智能CEO马啸曾告诉36氪,进入红海市场后,TWS耳机市场将由两类玩家主导:一种是手机厂商持续推出自有品牌的TWS耳机,主打通用场景;另外一种则为专攻垂直市场的TWS耳机厂商,以差异化的产品填补市场空缺。
未来智能瞄准的,则是办公这一垂直场景。在传统TWS赛道,未来智能已经靠讯飞会议耳机Pro、Air系列,做到了办公场景的“天花板”。未来智能董事长胡郁曾对36Kr自信地表示:“苹果的AirPods开创智能耳机品类,未来智能在耳机形态上实现了办公会议助理的创新,在这个细分领域里做到更佳。”
站在如今的AIGC风口中,未来智能定义的“AI会议助理”,自然地演进为办公场景中的个人的生产力标配。
2023年5月,未来智能发布的讯飞会议耳机 Nano系列,从拥有降噪、“Easy wearing”等单点迭代的记录机器,进化为了拥有强大脑力的生成式AI会议助理viaim AI。
将一颗“大脑”,植入耳机
办公,这是一个用户敏感度苛刻到以“毫秒”、“个字”为单位来描述传译时延和翻译准确率的场景。
转写准确率,是办公耳机的基本功。一旦“听写”的基本功不牢,翻译、摘要、总结等功能再好用,最终也难为无米之炊。
但90%的转写准确率,已经是市面上大多办公耳机所能做到的天花板。这意味着10个字中,就有1个错字。在完美主义至上的工作场景下,用户们并不敢希冀一副并不“耳聪”的耳机,就能解放双手。
而未来智能在2023年5月发布的Nano系列耳机,将听写准确率抬高到了98%。扎实的基本功,由录音实时转文字、外语实时转译、语气词过滤、智能分段与排版、说话人识别等多个功能组成。
十多年来对语料和场景的积累,是未来智能立足的巨人肩膀。支持10种语言、12种方言、10个行业术语词汇——Nano系列耳机在语言和行业上的优势得以凸显。
“听写”的基本功已经夯实,未来智能要做的,则是让耳机更加“耳聪目明”,让用户在工作中真正解放双手。
内置在Nano系列耳机中的viaim AI,则是一颗灵活、有效的大脑。比如,viaim AI可以成为“会议助理”,智能分析转录的会议内容,一键生成总结摘要,也能成为“任务管家”,根据会议生成待办事项。
更重要的是,相较于传统办公耳机,viaim AI的进化并不依赖于厂商的调试,而是随着用户数据和场景的积累,不断自主迭代。这意味着,viaim AI的能力是没有天花板的,马啸形容:“未来它将是化繁为简的整理大师,事无巨细的AI私人助理,甚至还将是一个整合信息的专家智库。”
但在马啸看来,初代的viaim AI,还没有完全释放智能TWS耳机的产品力。
初代的viaim AI,会摘要总结,会安排事项,但似乎还不够聪明,因为它缺了点“交互”
如今,升级版的viaim AI学会了跟“主人”聊天了。通过新增的“有问必答”功能,用户只需要用语音或文字输入问题或需求,viaim AI在根据转写记录回答当前问题的同时,还能主动提供和补充扩展信息,再一次提升办公效率和质量。
开箱即用,则是让技术通过产品普惠的核心要素。讯飞会议耳机Pro 2新增了全球首创的“红点录”这一闪录功能,用户只需要推开耳机壳盖,按一下电池盒中的红色按钮,就能直接录音。传统的转录功能,最怕的就是突发来电的打断。而讯飞会议耳机Pro 2耳机的“安心录”模式,则为录音阻隔了电话的干扰。
当然,翻译基本功的升级也必不可少。随着全球旅游和跨国差旅数量的回升,实时传译的市场需求也愈发庞大。讯飞会议耳机Pro 2则将支持的语种从原有的11种,扩充到了32种,并且在12种方言的基础上,扩充了2种民族语言。
“大脑”的进化外,讯飞会议耳机Pro 2并没有忘记体验的提升。作为职场人,我们往往需要克服嘈杂的环境,快速响应突发会议或者紧急电话。讯飞会议耳机Pro 2看到了这一需求——在三麦克风通话降噪算法上,讯飞会议耳机Pro 2耳机新增了骨声纹拾音麦克风,利用头骨震动的方式精准采集用户声音,大幅提升通话质量。即便用户身处嘈杂环境,也能清晰如同面对面交流。
比AI更有价值的,是幕后的大脑
未来智能CEO马啸,在一次采访中谈到了自己对语音助手的愿景:
“我们的判断就一句话:每个人都有一个能理解他的随身智能助手,不是人,是个机器人,或者别的形态,无所谓。”
在他看来,在语音交互并未全面爆发的背景下,他们不会追求大而全,而是向垂直场景渗透。2018年,他选择走在时代前面,试水全球最早的翻译录音耳机雏形Mobius。四年后,他验证了自己“深入垂类场景”的战略判断。
但产品战略怎么做、市场运营怎么跑、公司该怎么经营,作为一家独立的年轻公司,未来智能还得自己打仗。
好在,这是一个六边形的团队。董事长兼创始人胡郁,也是科大讯飞的联合创始人,是脑科学和人工智能领域的专家;CEO马啸,有超过10年的AI智能交互产品研发和孵化经验,是全球首个中文智能语音助理“灵犀”的缔造者;CTO王松,则有百人研发团队管理经验和15年的软件研发经历,长期从事智能助理产品开发;CPO柳达,是有三次创业经历的行业老将。
事实证明,不少成功的产品,往往是贴着用户的刚需,做“反常识”的生意。
当Scaling Law已经成为大炼模型的共识,狂堆参数的“大”成了众多厂商竞速的方向。但马啸不以为然:“经过我们的测算,不需要大模型那么大的参数量 也能够满足绝大多数会议纪要生成、日程提取的需要,同时由于训练数据更加适合专业场景,有限规模的‘垂直模型’反而效率更高。”
生硬地将通用大模型塞进耳机中,不仅功能空泛鸡肋,在能耗和成本上也并不合适。未来智能的思路是将垂直模型做小、做精。
瞄准办公垂直场景,未来智能将RAG(检索增强生成)技术与自研的垂直模型结合。RAG,好比大脑的自我学习能力,随着用户操作形成的自训练数据的积累,讯飞会议耳机中的viaim AI会愈发聪明和懂你。
未来智能的另一个“反常识”,则是在创业初期,就布局了硬件供应链。
对于不少创业公司而言,在资源有限的情况下,往往要有的放矢,把住单点的核心竞争力。更何况,供应链是需要长期积累的硬本事。因此,不少AI硬件公司会选择先在软件上下功夫,在功能上创造一个“长版”吸引客户,等营收提升后再迭代非核心卖点。
马啸则认为,不能用软件思维进行硬件创业,硬件创业的用户偏好更能体现短板效应。以耳机为例,只要音质、外观、续航、降噪等性能中有一个短板,即便AI大脑再强大,也难以提升用户使用时长和留存。
未来智能对供应链的打磨,使得如今的讯飞会议耳机,拥有了天花板级的硬件组件。
讯飞会议耳机Pro 2系列耳机细腻音质的背后,是11mm镀钛原生刚性振膜单元、具有高弹性和刚性的TPU镀钛材质,以及讯飞AI音频实验室的专业调音;深度可达48dB的降噪深度游,领先行业。为了让用户彻底告别续航焦虑,讯飞会议耳机Pro 2系列做到了单次9小时、搭配充电仓36小时的续航时长。
再比如,设计和体验也是产品的“门面”。在办公耳机品类中,讯飞会议耳机Air系列开创性地使用了“颈挂+耳挂”的可切换佩戴设计,颈挂佩戴可以减轻入耳式对耳部产生的负担,耳挂模式则更方便收纳盒携带,让用户可以灵活利用通勤、运动时间,不耽误通话和听音乐。与讯飞会议耳机Pro2同期发布的iFLYBUDS 2,采用的则是半入耳设计,更适合耳道敏感的人群。
软硬一体的打磨,未来智能实现的是AI风口中,产品和用户的双赢。
当众多AI应用仍苦于难以变现的“概念”,或仍停留在漫长的投入期,未来智能的PMF,已经被市场验证。2023年“双十一”期间,未来智能会议耳机全网GMV同比22年实现了564%增长,跻身人工智能会议耳机品类销冠,实现多个电商平台霸榜。
“在AIGC领域,垂直场景的服务性工具比泛智能工具实用性更强,未来智能在垂直的办公会议领域,已经形成了数据的马太效应,打造出了非常实用的AI会议助理。”发布会上,马啸如此表示。从“智能工具”到“智能助理”,如今的未来智能,已经离马啸“随身智能助手”的愿景更近了一步。