10 月 24 日,科大讯飞第七届世界声博会暨 2024 科大讯飞全球 1024 开发者节,在本次大会上,全新讯飞输入法 14.0 正式亮相。
当前生成式 AI 的发展正如火如荼,特别是端侧 AI 大模型正处于快速演进的阶段。
一方面,随着模型技术的进步,模型参数越来越小同时也可以做到效果越来越好,我们可以看到 2024 年以来包括 Meta、谷歌、苹果、微软等行业巨头都推出了自家适合终端侧运行的“小模型”。与此同时,移动终端 SoC 芯片的 AI 算力也在逐年大幅地攀升,终端性能越来越高,共同推动大模型在垂直、边缘的行业里去应用和落地。
另一方面,随着生成式 AI 持续向着垂直领域应用和落地,原来的“对话式”通用型 AI 原生应用也在广泛升级为面向垂直领域的“智能体”,加速 AI 融入大众场景。这些“智能体”能够帮助用户“一站式”解决很多问题,“术业有专攻”,这也是目前生成式 AI 商业化过程中被普遍看好的应用方向。
在这两大背景下,输入法作为从互联网到移动互联网再到万物智联时代不变的基础入口之一,应对生成式 AI 变革各行各业的浪潮,又该如何变化?
面对这个问题,科大讯飞认为,生成式 AI 输入的时代,输入法眼前必须解决三个用户普遍存在的问题:
首先是用户使用云端大模型输入服务成本高的问题;
其次是用户对生成内容的多样化需求难以被紧凑的键盘界面满足的问题;
第三则是使用通用模型难以解决用户沟通场景体验问题。
相信关注讯飞输入法的朋友应该知道,从去年的 13.0 版本开始,讯飞输入法就已经将生成式 AI 融入到输入法体验中了。而为了进一步解决上面的三个新问题,讯飞输入法发布了 14.0,行业首次为输入法带来了讯飞星火端侧输入大模型的加持,这是讯飞输入法进一步尝试用 AI 重塑表达,普惠输入体验的版本。
那么讯飞输入法 14.0 的实际体验到底怎样?IT之家已经提前拿到了内测版,今天就和大家分享一下体验报告。
一、联想功能体验
在安装讯飞输入法 14.0 后,大家可先点击键盘上方功能界面左上角的“讯”字图标,然后找到“活力视界”,点击后就可以体验专为生成式 AI 输入定制的交互。
在讯飞输入法 14.0 上,活力视界升级到了 2.0,更加充分利用传统的“工具栏”位置,在屏幕与键盘之间留有更大的空间,赋予推荐区更丰富的属性。同时相较于上一版本,界面设计风格更清爽,既保持扁平化的简洁,又像拟物那样表达关联的特征。
同时活力视界 2.0 在推荐区延续卡片化设计的 AI 助手来推荐内容,让信息的呈现更加灵动便捷。
讯飞输入法 14.0 旨在打造“每个人的 AI 输入”,让用户感受“更准确、更高效、更懂你”,意思是输入法可以不断学习用户的个人输入习惯,越用越懂用户,从而让输入的内容更准确,更高效。
这首先体现在讯飞输入法 14.0 在讯飞星火端侧输入大模型加持下的拼音 / 语音联想输入上。
1、AI 增强整句联想功能体验
相信大家在使用输入法时都有过这样的期望:就是当我想输入一些可能经常会表达的话时,每次都要手动把完整的句子打出来,很麻烦。如果输入法能在我们打出前几个字或者上半句时,就能”知晓”我们想说的下半句并提供出来,那就快多了。
讯飞输入法 14.0 的 AI 输入增强就是这个意思。
在第一次使用前,大家需要在讯飞输入法键盘输入设置-辅助-AI 输入增强栏目中下载并启用讯飞星火端侧输入大模型,启用后,就会通过讯飞星火端侧大模型的 Al 能力,带来 AI 增强联想、AI 增强整句预测、AI 增强整句联想的效果。
并且由于是端侧大模型,因此即便在手机没有联网的状态下,讯飞输入法 14.0 依然能实现这些联想和预测的功能。
与传统云端大模型相比,讯飞星火端侧输入大模型的参数更小,直接使用手机本地的算力运算,响应迅捷,不用联网也能拥有接近云端的效果,更加适合个性化的 AI 应用。通过端侧大模型技术的赋能,利用本地 AI 优化解码效果,就可以有效突破场景限制。
不仅如此,讯飞输入法 14.0 还在技术层面采用全新的 AI 插件化构架,使得输入法灵活拓展多种 AI 模型,让更多用户用上本地的 AI 输入能力。
首先体验一下 AI 增强整句联想。举个例子,当小编输入“出门在外都不容易”,当我按下这一句的逗号时,活力视界 2.0 的推荐区就帮我联想出了下一句:“这点我深有体会。”
如果你刚好正想说这句,那么它的推荐可谓恰好好处;就算你当时接下来想说的不是这一句,其实加上输入法联想的这句话,绝大多数时候也会让表达更得体、具有共情力。
然后小编又换了一个例子做测试,先在 QQ 中输入“今天晚上想吃什么”,输入法联想出的下一句“我请你”,刚好是小编接下来想说的,于是点一下就上屏。
然后小编接着输入“最近公司旁边新开了一家川菜馆”,下面小编打算说一下这家川菜馆哪里比较好,输入法首先联想出“味道不错”,可用就点一下。接下来它又联想出“价格实惠,”也可以直接用。随后联想的内容并非小编想说的,于是手动输入“环境也不错”,紧接着这一句,输入法联想出“服务也很好”,小编一看,这句也是我将要说的,于是直接点了补充上去。
可以看到,这个场景中,大概一半的话都是输入法帮我联想的,不需要我手动输入,这样一来,输入的效率自然就是翻倍了。
除了这些,小编在使用过程中还有一些让自己印象比较深的场景案例。比如当小编上一句输入的是:“以后不管发生什么,”讯飞输入法紧接着联想到了“我都不会离开你。”如果你正好想说这句话,那很好;若不是,也不影响你接下来输入要说的话。
2、AI 增强整句预测体验
除了整句联想能力,讯飞输入法 14.0 还支持 AI 增强整句预测,即能够根据你已输入的拼音,提前预测你要输入的句子,预测结果出现在输入拼音还未选词状态。
例如测试时,小编在输入框先输入了“我们马上到了”,当小编自然而然想接着输入“还有几分钟”,刚输入“haiyou(还有)”准备选词时,讯飞输入法 14.0 就预测出了“还有几分钟”这句话。正好是小编想说的,所以直接点击就 OK 了。
再比如小编先输入“宝贝到家别着急”,当我想输入下一句“,拼音输入到:“wohaizai(我还在)”时,输入法就直接预测出“我还在路上”,于是就可以直接用,然后小编又输入“youdian(有点)”,输入法预测出“有点堵车”,于是又可以直接用了。
根据小编的总结,AI 增强整句预测的内容,是可以学习小编平时的输入内容和习惯的,因为小编习惯在下班后的路上提前通知一下家人,经常会输入类似的话,所以讯飞输入法 14.0 就能根据我输入的拼音准确预测出接下来要说的内容,充当互联网的嘴替也是妥妥的。
3、增强词联想功能体验
此外,讯飞输入法 14.0 还支持 AI 增强联想功能,即它可以在你已输入上一句的情况下,下次输入选词并上屏后展现联想的结果。
还是以小编实测来说,当小编输入“我想一个人出去”,此时输入法给出了一些联想词,而当小编选择了“逛逛”这个联想词后,输入法又会联想出“散散心”,结合上下文,这个“散散心”还是比较妥帖的,当小编选择“散散心”后,输入法又会进一步联想出“放松一下”,同样可以继续使用联想的结果。
再比如小编在输入框输入了“昨天晚上喝”之后,推荐栏联想了“多了”,当小编选择“多了”之后,讯飞输入法 14.0 立刻联想到“现在才醒”,紧接着又持续联想到“不好意思”,“刚看到”。如果你是在酒醉之后的第二天早上看到有一堆消息没有回复,有了讯飞输入法 14.0,就可以快速地进行回复了。
另外根据讯飞的总结,在对语音输入效果的反馈中,有 75.3% 是网络问题导致的语音识别出错,而早前离线语音模型的准确率和云端语音差距还比较大。
但是,在讯飞星火端侧输入大模型的泛化能力加持下,这次讯飞输入法 14.0 的离线语音达到基本持平云端的效果。
而且,讯飞输入法 14.0 接入最新讯飞星火语音大模型,对方言语音输入进行大幅升级,即将支持 202 种方言“免切换语音输入”,覆盖近 300 个城市,让众多方言用户无感使用自己的家乡话。等功能近期全量开放后,小编可以再为大家做详细体验。
通过上面的体验和分享,可以看到讯飞输入法 14.0 的 AI 输入增强确实是比较实用的,在很多场景下,AI 主动生成的内容都能准确符合我们要表达的意思,而且这种准确度是随着大家使用时长累计不断提高的。由此就可以让我们的输入效率持续提高。
以上种种创新,让讯飞输入法 14.0 能够充分利用如今进步迅速的端侧 AI 算力,使输入法能够普惠广大用户,几乎无门槛的享受 AI 输入的魅力。这一点在接下来的 AI 助手以及百变人设等功能的体验中还有更充分的体现。
二、AI 助手和百变人设功能体验
除了在日常输入过程中会为我们提供基于 AI 的联想辅助输入体验,本次讯飞输入法 14.0 还革新了 AI 助手功能,将 AI 助手细分 12 个场景,并拓展了超过 100 种人设聊天风格。
1、场景化 AI 助手功能体验
具体来看,目前 12 中场景化 AI 助手囊括了日常使用的方方面面。
小编以大家可能最常会用到的“高情商沟通”为例来测试,点击活力视界 2.0 左上方“AI 助手小蓝”,就可以进入 AI 助手界面,输入栏里输入想说的内容选择高情商沟通,比如:“委婉拒绝不想去的饭局”,AI 助手立刻就能帮你写出 5 段理由充分,表达得体的高情商话术,大家可以直接使用或者根据自身的情况稍作调整,完美解决工作和生活中碰到一些不想去的饭局不知道该如何委婉拒绝的难题。
再比如工作中和同事交流时,难免会遇到意见不同,或者提醒同事某些工作上的问题的情况,有时候话说不好,就容易引起矛盾。这时也可以使用讯飞输入法 14.0 高情商沟通 AI 助手来帮忙。测试时,小编让它帮我想一个委婉提醒同事方案预算过高的话术,AI 助手果然生成了 5 个很得体的沟通话术,既肯定了方案的优秀,又指出了不足,不至于得罪人,基本上可以直接使用。
除了高情商沟通助手,小编还体验了“恋爱军师”助手。首先设置我的恋爱人设 —— 男生,初识期,性格风趣幽默,然后就可以用 AI 辅助我们和对方聊天了。
比如很多人在恋爱初识期不知道怎么和对方开场,寒暄问候,就可以找到恋爱军师的“恋爱盲盒”功能,找到你想要切入的话题。比如用“万能开场”,AI 助手帮我写了一句“看到你的朋友圈,感觉你是个很会生活的人(调皮)。”这句话看起来既不生硬也不尴尬,确实是可以参考使用。
同时在“恋爱盲盒”中还提供了一些女生可能爱聊的话题,比如小编选择“探店打卡”,AI 助手就直接帮我想了一段切入到“探店打卡”相关话题的话术,看起来还是比较自然的,根据自己的情况稍微改一下套用。
恋爱中如果做错了事,如何跟对方道歉也是比较有讲究的,比如小编让它帮自己更好地表达“对不起,昨天约会迟到了,下次一定准时”这个意思,恋爱军师给出了 5 个话术,看起来还不错,不过小编希望更加“撒娇一点”,就可以点击下面的修改选项,然后“恋爱军师”又重新给出了 5 段话术,明显更加具有“撒娇”的意思了,这么软萌的话,相信女生看了有气也会消下去吧。
2、百变人设功能体验
场景化 AI 助手可以让我们在一些具体的场景下能够有更好的表达,而超过 100 中的人设聊天风格,则可以涵盖更丰富更广泛的聊天场景,用不同的说话风格满足不同的个性需求。
例如在百变人设中,小编将人设选为“皇上”,输入一段“晚安,早点睡,明天还得早起呢”,让输入法转变为“皇上”的人设口吻,从它提供的结果来看,5 种说法都十分风趣幽默,日常和朋友聊天时可以大大增加聊天的趣味感,拉近彼此的距离。
再比如日常聊天时用文言文风格,也会增加聊天的趣味性,让人感到幽默。比如小编输入“哥们儿,这瓜多少钱一斤?”AI 助手提供了 5 种文言文风格,每一种都体现文言文风格,但又不会生涩。
再比如直播带货的人设,小编编写一句介绍手机的话,让 AI 助手帮我改成直播带货的口吻,看到生成的 5 条结果时,满满的直播间既视感就出来了。这样的百变人设不仅有趣,而且也具有实用性,如果你是主播,讯飞输入法 14.0 的这个功能显然能为你带来很大的帮助。
除了可以使用已经提供的人设,讯飞输入法 14.0 还可以支持用户自己创作人设。比如小编自己设定一个翻译腔的人设,待发布后就能使用。或许这是一种新的玩法,大家可以编辑自己理想中的人设风格,俨然在数字世界独一无二的分身。
3、AI 营销助手功能体验
最后值得一提的是,讯飞输入法 14.0 还为不同人群特别是行业客户引入定制化 AI 营销助手。如果日常工作中对一些营销话术表达有需求的朋友,可以在讯飞输入法 14.0 主页-“我的”-“特色服务”中找到“AI 营销助手”功能并开通。
开通后,大家可以根据自身的工作内容选择相关的内容合集,每个合集中都有一些常用的营销话术可供即时使用。
不仅如此,讯飞输入法 14.0 还可以根据用户输入的内容通过 AI 营销助手来进行优化表达。比如实际使用时,小编先在聊天框输入了一段欢迎客户常见的营销表达,然后小编点击讯飞输入法 14.0 的“AI 助手小蓝”图标,就可以在之前 AI 助手功能栏中发现多出了营销助手,点开后就能发现,AI 营销助手已经将上面小编输入的这段话通过 AI 能力转化为更加专业、更生动和优秀的营销话术了。
结语
“向用户提供的不是工具,而是一种服务,即通过技术持续创新将工具类产品服务化。”这是科大讯飞输入法业务部总经理程坤对输入法下的新定义。
而纵观讯飞输入法从推出至今的 14 年里,其实就是在做两件事,第一是以语音技术为核心去构建高效的服务体验,第二是降低语音输入的门槛。这两件事背后还有一条暗线,就是 AI 与语音技术的结合。
而在 2020 年至今的三四年里,全球技术风向正在发生巨变,生成式 AI 星火燎原。就像程坤在本次发布会现场所说的:
我们讯飞输入法已经有 14 年历史了,但我觉得现在又开始了一个新的篇章,一个由 AI 大模型带来的新篇章。我们希望随着 AI 技术的不断发展,我们在这上面不断地尝试和去验证。
Mob 研究院此前在 2023 年中国第三方输入法行业洞察报告中指出,“AI + 输入法 + 场景”正成为行业标配,进一步他们认为“输入法 + AI 大模型”将成为未来的重要趋势。
从IT之家的体验来看,讯飞输入法 14.0 确实做到了“AI”+“场景”+“输入法”的美妙融合,能够对用户在各种场景下的交流、表达效率和效果有非常明显的提升,假以时日,随着生成式 AI 技术以及产品本身的不断完善,相信它真的能够实现“构建人机交互新模式”的革命性愿景。