21世纪经济报道 记者郭美婷 实习生林婉娜 麦子浩 广州报道
在ChatGPT点燃全网热情的时候,严虹并不为所动。
这样的“狼来了”,在速记这一行已经喊过无数次,“现在都已经无感了。”
速记是一门将稍纵即逝的口语转化为书面文字的职业。在全国多个大型会议中,常常能看到速记员(业内官方称速录师)的身影。但速记的圈子又很小,今天,在一线城市,如北京,有两百多名速录师,而在二三线省市,如贵州,这一数字仅为4人。
ChatGPT带火了AI大模型,而AI大模型正逐步赋能于具体行业的具体领域。目前来看,语音识别赛道率先有了动作。
6月1日,阿里云宣布聚焦音视频内容的AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。通义听悟接入了通义千问大模型的理解与摘要能力,能够完成对音视频内容的转写、检索、摘要和整理。
6月9日,科大讯飞的软件产品“讯飞听见会写”也迎来了讯飞星火大模型发布会后的首次大版本更新。据介绍,讯飞听见会写不单集成了语音转文字的能力,还能提炼出会议纪要、生成待办事项,利用AI编写稿件等。
不少人预测,ChatGPT的出现标志着新一轮产业革命的开始——这一次,“狼”真的要来了吗?
“反向宣传”
速记员会不会被AI取代?十几年的职业生涯中,李君隔三岔五总得被问一遭。
在我国,现代速记可以追溯到19世纪90年代末,但行业在2000年后才真正发展起来。2003年,速录师正式收入《中华人民共和国职业分类大典》,在当时媒体的描述中,速记是一个“新兴朝阳职业”,高薪且人才告缺。2013年,北京市速记协会披露数据称,全国文秘速录人才缺口已达到25万左右。
李君就是在那几年入行的。她出身于贵州贫困山区,因一次扶贫活动进入冰心女儿吴青开设的农家女学校,经过公益培训后,“阴差阳错”地学了出来。
那时候她还没有人工智能的概念,也不知道语音识别。“我刚出来工作时买的第一台手机恰好用的是讯飞输入法,我第一次知道‘讯飞’俩字。”只是李君不知道,在后续多年中,外界关于她所从事职业的讨论,将始终伴随着以这两个字被代表的一批智能语音识别企业的崛起。
从2016年李世石惨败阿尔法狗,到2022年底ChatGPT横空出世,AI的智能程度一次次颠覆了人们的认知。近期,关于AI取代人类岗位的言论再起,满城风雨。
但在速录师自己的圈子里,AI技术的进步似乎暂时还跟不上他们业务扩展的速度。最早的时候,李君在北京工作,后来回到贵州,开始也只是给外地同行整理录音,本地很难接到活计。随着经济快速发展,数博会、酒博会、生态会等标志性大型活动越来越多地在贵州举办,当地会议市场逐步兴起,速记也因此有了更广阔的“用武之地”。李君感觉,至少在疫情到来之前,速记的发展势头是一年比一年猛的。
从报酬来看,据北京速记协会出身的元元介绍,鉴于速录师的资历水平、服务的客户群体、速录文稿用途等客观因素不同,收费标准各异,一般在600-3000元/半天。
多位速记从业者向21记者反馈,相比于AI,真正给行业带来切肤之痛的是疫情。疫情前,李君的平均月收入在1.5万左右,而突如其来的疫情使得大量会议无法线下召开,她的收入在前几年近乎腰斩,今年市场也许会逐步回暖。
AI当然也会有影响。来自北京的速录师严虹偶尔会听到同行抱怨,语音识别让他们失去了一些大客户。一些要求不高、难度不大的速录工作,通过人工智能技术即可完成。
但也存在一些有意思的现象。李君和严虹均提到,原本,除北上广深等一线城市,速记的知名度并不高,很多地方甚至不知道这一行的存在。而AI、语音识别相关企业铺天盖地的推广,竟也反向宣传和科普了一把速记行业。她们损失了一部分老客户,同时也结识了许多新客户,或者有的客户试用了一段时间的语音识别后,又倒回头来找了速记。
深圳市黑匣子速记有限公司(下称“黑匣子速记”)同样观察到,部分单位在采购了AI语音识别服务后的使用率并不高,存在闲置现象。
事实上,让黑匣子速记困扰的还另有因素。这两年,保密规定趋严,限制了第三方速记服务商参与保密性的内部会议的资格,而保密资质又门槛太高,不适合小微速记企业的现状,对公司业务造成较大冲击。
大模型再加工
大屏幕上,演讲内容由AI语音识别转写为字幕,实时呈现给观众;台下角落,速录师手指快速敲击键盘同步记录,并在会后输出一份详尽的速记稿。台上台下,既各司其职,也无言较量。这样的场景在近两年的大型论坛上并不鲜见。
多年从事速记的经验让李君深刻感受到语音识别技术的变迁,“从连分句、分段等都无法完成,到标点符号的使用越来越规范、能够区分讲话人、过滤‘口水话’,技术的进步加上宣传造势,焦虑感还是有的。”但也在这个“切磋”过程中,让她坚信人类仍有不可替代性。
多位速录师认为,AI语音识别对环境、口音要求高,“听到什么就记录什么”,筛选、识别功能弱。有时候,客户委托整理的录音文件中,会附带一份语音识别文字稿,他们曾尝试在该稿的基础上进行加工修改,但所花费的时间往往比从头听录音整理要长。
相比于每句话都原封不动地记录下来,李君如今可能会在开会前与客户沟通速记稿的用途,是用作宣传、存档还是会议纪要,并根据需求考虑合理的取舍和总结。
“有的情况,客户要求文稿不仅是准确,而且要做到‘信达雅’,例如用于出书,这样的话还是人工速录最严谨。”元元补充。
厦门大学信息学院副教授、智能语音实验室负责人洪青阳指出,在较理想环境(如近场、相对安静)下,通用领域的语音识别准确率一般可达95%以上。目前语音识别技术主要在三方面存在难点。
一是特定领域(如电力、医疗等)专业、生僻的术语识别难,需要专门收集语料对原来的模型进行微调训练,开发有针对性的行业模型;二是重叠语音或复杂场景,如会议场景中的插话、正话反说等,仍是目前的研究难点,需要从软硬件两方面入手,如创新算法、增加收音的麦克风,以更好地进行声源的定位聚焦。三是多语种、语种混杂和方言场景,这也是非常迫切的需求。
以ChatGPT为代表的大模型的接入能够解决部分问题。目前,国内市面上公布的已经接入了大模型的语音产品,包括阿里云通义听悟和讯飞听见会写。
阿里云通义听悟技术负责人鄢志杰向21记者介绍,大模型在语气词过滤、分段、提炼改写等方面,能有效的提高文本的可读性,同时对一些典型的语音识别错误,如同音词、专属名词等进行纠错。此外,大模型的加入还能延伸出进一步的应用,如分段、摘要等。
但这种优化是在语音识别这一步骤之后。科大讯飞听见会写产品经理江嘉辉解释,目前大模型能接收并理解的信息还是以文本为主,这意味着语音识别仍然是一个单独的任务。接入大模型后,可以在语音识别的模块下,通过语言理解能力和概括表达能力实现动态会议记录、会议内容自动整理输出,一键生成多种类型的会议文案等功能,助力用户高效办公。
“随着大模型将往多模态的方向进一步发展,我们期待下一阶段大模型能够听懂声音。”江嘉辉表示,那时就能够更直观地知道大模型到底给语音识别的准确率带来了多大程度的提升。
不过,现阶段仍需警惕型生成内容的可靠性。洪青阳提醒,大模型根据语音识别文本再生成新的文本时,可能会存在常识性错误,如张冠李戴、理解偏差等,如果上一步语音识别错误较多,这种偏差还将进一步加大。
人机耦合
从事速记曾给李君带来莫大的自豪感和成就感。每一次参会,她都能汲取新的知识,她将这种感受形容为“站在巨人的肩膀上看世界。”
过去一段时间,她密集地接到与法律相关的会议任务,由于会议内容专业性较强,她不得不一次次地上网查询相关用语,慢慢熟悉了这个领域。趁着疫情期间赋闲在家,她自学通过了法考。
李君这一代速录师仍然对行业怀有热忱,然而,他们也能感觉到,学习速记的人越来越少了。
一方面,受到人工智能的影响,很多人担心未来职位会被取代,不敢贸然入行。另一方面,速记本身学成率低,培训周期长。
“与十几年前速录培训行业的火爆场景相比,不可同日而语。”元元提到,之前全国有几十家培训机构、高等院校开设速录课程,目前没剩下几家。南方的速录培训行业尚可,但主要就业出口是法院。在速录行业中,法院并不是最理想的就业选择,要求的技术水平不是很高,一般速录求学者还都是朝着能独立上会的高级速录师的方向努力。
李君偶尔也感慨,“等我们这拨人老了,贵州就真的没有速记了。”她带了两个小徒弟,其中一个已经在实习,可能明年就能自己上会。“他们两个就是贵州未来的希望了。”
在采访中,这种不安并没有持续太久,很多速录师表现出了对人工智能技术的欢迎和接纳。他们希望AI能够辅助到他们的工作中。
黑匣子速记认为,速记+AI或许是未来的发展方向。设想,如果速录师记录文字的同时,AI可以协助他们审核校正文字中的错别字、语法、专有名词等,那么工作起来就会更轻松。
严虹则提到,最初速记上会是双人搭档,或一人主打,一人修改,或两人交替分开打,但后来普遍变成了一人负责整场会议的速记,这要求速录师全神贯注,一刻不可松懈。未来AI的发展能否补齐“双打”中的一员,值得期待。
关于速记行业的人机耦合,技术专家们多数提出AI先识别,人再进一步修正的思路。如鄢志杰认为,未来AI可以将逐字记录的过程承担下来,速录师则从精神高度紧张的中解放出来,关注后续的摘要、提炼、整理等。人工如果对机器生成内容就行了纠错、总结等,从算法角度讲就是一种数据。如果这些数据能够被提供用于模型进一步训练,将有效帮助AI进步,从而更好帮助到速录师。
“这意味着速录师可能需要更关注一些难点,如专业术语、表达习惯、语种混杂等,审核修正AI还无法解决的疑难杂症。”洪青阳说。
据江嘉辉了解,目前已经有一部分速录师在使用科大讯飞的实时录音功能,以提高效率。结合AI大模型,他构建了“AI语音识别-大模型修正-人工精修-大模型校正”的合作链条,“机器对于检查错别字有一定的优势 ,人类在语音理解上更胜一筹,后续如果需要更高效的内容处理 ,如生成摘要、文章或者会议记录、简报等,也可以使用大模型辅助生成。”
不过,等到技术真正深刻影响行业,也许还有一段时日。今年以来,速录师们的工作已经恢复了忙碌。在受访的前一天,严虹在某大学参加了一整天的会议,忙碌到晚上10点,又在第二天7点起床继续工作。即使不去参会,她仍要整理客户发来的一批批录音文件。
“当初语音识别技术刚出来时,我们担心速录师被取代,如今ChatGPT的出现却让我们觉得各行各业都可能被取代。当每个行业都处在同一起跑线的时候,我反而不着急了。”谈及未来,李君笑言:“(科技)来就来吧,我就想着怎么让自己的行业跟科技结合在一起,然后继续生活下去。其实都是工作,只是干的方法不一样了。”
更多内容请下载21财经APP