ChatGPT腾空出世,不可一世的google首度发出红色预警,因为AI的出现动摇了搜索引擎的根基,AI与web3.0的出现让互联网世界格局的地基发生了深入根部的裂痕,确实因为AI的出现,让搜索引擎变成了上古获取信息的模式,国内各种AI大模型也纷纷发布,首当其中的就是百度,阿里与科大讯飞。
科大讯飞前一阵子发布了讯飞星火认知大模型,众所周知,科大讯飞本身的优势就是语音识别技术、翻译这类听、说、理解语义这些方面,所以讯飞在AI方面发力是可以预料的,因为AI技术层面的加持,对于讯飞目前的领域是可以产生质变的。
讯飞目前推出的AI+硬件也都是结合其自身优势的产品。
现在有了AI的加持,讯飞家的产品都可以加上智能两个字了,而且是真正的智能。其中就包括科大讯飞的拳头产品——科大讯飞智能录音笔SR702。
一,哪些人群会用到录音笔(or翻译机)?
二,用得着买这么贵的录音笔?为什么不用手机?
三,高端录音笔应该做成什么样子
四,AI加持,目前国内最贴近实用的[真智能]硬件
五,AI带给我的思考
一句话说清楚区别就是,工作量。
当今社会不管学校还是职场,录音笔的应用越来越普遍,但如果你只是普通学生,或者简单的文字工作者,我不会建议你买高端录音笔,普通录音笔足够了,前提是必须能录音转文字,不能实时转写成文字的录音笔只会增加你的工作负担,已经早就被淘汰了。而当你有足够多文字工作需要做,或者你的工作属性对音频整理成文字有时效性的要求,再或者你有大量与老外打交道的时间,这时候我建议你有必要标配一支高端智能录音笔或者翻译机。
比如你是个律师,现在有个案子要整理20公斤正反面的A4纸质文件,你怎么办?
或者你是个记者,现在有一个演讲要做采访,当事人提出的很多观点与内容都是首次披露,很多同行的记者都在抓紧时间录音,你怎么办?
或者你是一个外企员工,每天的工作就是与老外打交道,每天面对不同国家,不同语言的客户,说着专业领域的专业词汇,虽然公司配有翻译人员,但毕竟人是有下班时间的,你加班时面对大量外语录音的时候,你怎么办?
再或者你是一个作家、编辑、视频博主,你有大量的创造性思维需要快速记录,并整理成文字,你会怎么办?
所以,录音笔适合哪些人群?大概也就是律师,记者、编辑、作家、讲师、视频自媒体、音乐创作者、外企员工之类的吧。
录音笔是一个使用领域非常广泛的产品,我们大部分人大量时间都要面对工作,所以录音笔才有了现在大量的市场需求。现在很多人都在纠结手机录音和智能录音笔的区别,甚至怀疑必要性,这么说吧,我相信很多人在临时情况下需要紧急录音时,如果你只是拿手机凑合的时候大概率会遇到:本以为录上了,实际因为距离远,听不清对方说什么的问题;可能你会遇到等你在手机上找到录音软件,对方已经说完了的问题;再或者一个电话中断了录音。
那有必要买录音笔吗?这里科普一个冷知识,在商业行为中音频转成文字是要收费的,OCR图片识别文字一般也都是收费服务。
【讯飞语记APP】是一款可以实现录音转写,OCR识别,笔记翻译等功能的软件,也是讯飞家的,如果想使用全部的功能,SVIP是418/年,当然这里只是拿讯飞语记举个例子,市面上的其他产品也同样都是如此。而其些功能在科大讯飞智能录音笔SR702 是全部可以免费实现的,而且SR702还送三年20G免费云空间。
以上是软件方面的功能,在硬件方面科大讯飞智能录音笔SR702有3.5寸屏幕,3D陶瓷背板,800万像素,2600mAh电池。Ok,这些都不如手机,但SR702还有两个10mm的定向麦克风可以接收15m远距离的声音,还有6个全向麦克风,双击即可录音的快捷键,陶瓷背板手感极佳,顺滑而舒适一手可握的体积,与172g的重量。这些让SR702在记录声音方面有着绝大优势。
因为录音笔的硬件配置相比手机更强大,软硬结合的功能更多,而且很多收费项目可以免费使用,也就是说,用的越多越省钱,计算下一年需要开多少个会,有多少文稿需要整理,算一下使用频率就会发现确实物有所值。
科大讯飞智能录音笔SR702是一款典型的高端录音笔,受众面向高级商务人群,但是功能面向人群是非常广泛的,简单看一看产品,让有需求的人在入手前可以通过文章来了解产品是什么样的,能实现哪些功能。打开包装之后是一个3D陶瓷背板,航空铝合金机身,3.5寸触屏,重量只有172g的录音设备摆在你面前。
顶部两颗定向收音麦克非常醒目,经过测试随意将麦克对向声源,录下的声音会比本人听到的声音更清晰,是因为在机器正面屏幕两侧分别还有六颗全向收音麦克,2+6的配置配合智能降噪,让你可以完整纪录当时身边发出的一切人声。
背板是3D陶瓷工艺,只手可握,清凉而顺滑,顶部为了满足10mm的定向麦克风与摄像头会稍微厚一些,手握机身部分非常轻盈与纤薄,手感极佳。
两个麦克风之间是一颗800万的摄像头与闪光灯,可以用于OCR拍照识别文字、表格。还可以用于拍视频并实时生成字幕。
底部左侧是外放,右侧是为了对称挖的孔,充电是type-c口,也可以用于连接电脑传输录下的音频文件,导出的文档。
左侧分别是录音键与音量键,任何场景双击录音键即可开始录音,快捷又隐秘,长按则会呼出语音助手,可以进行一些简单的语音控制。
右侧为开关机键与sim卡槽。
科大讯飞智能录音笔SR702支持离线录音转文字,如果你在可以联网的场景可以将文字准确率提高到98%,除了中文还支持英语、日语共10种语言转写,方言更是不在话下,甚至还支持藏语与维吾尔族语的转写,我试过2019年的藏语电影《气球》,翻译效果与字幕无异,甚至获得了更多信息(比如一些脏话,呵呵)。
科大讯飞智能录音笔SR702还支持英、日、韩、俄、法、西班牙、越南语7种外语与中文互译,我用《星际穿越》、《进击的巨人》测试英日两项的互译,效果极强。可以免费无限制使用图片OCR转文字,800万像素摄像头在此起到了作用,智能提取PPT,excel内文字,都是轻松搞定,甚至手写笔记也可以识别。此外录制的视频也可以自动生成字幕,对于视频自媒体作者可以提高工作效率。
但是,这些并不是我最想讲的,各位看一看其它视频测评,可以更加全面的了解SR702可以实现的功能,而今天我想分享的是——AI,是讯飞星火认知大模型加入之后的SR702智能录音笔,这将是一个全新的产品。
以上是科大讯飞智能录音笔SR702的传统艺能,在未加入星火认知大模型之前以上功能也都能实现,算是人类社会未出现AI之前最接近智能的效果了,也都是科大讯飞的传统强项。科大讯飞在发布自家AI大模型之后,SR702增加了两个功能,分别是【语篇规整】与【会议纪要】。
语篇规整的功能点是可以通顺整篇文章的语句,其官方的说法是一键将口水稿转为书面稿。也就是说当我们用录音笔录下一段演讲或者采访的时候,录音笔会自动把录音转成文字稿,当人在口语表达的时候是不可避免的会出现逻辑颠倒,也可能说很多口语助词、语气词之类的,这种情况就特别适合【语篇规整】这个功能。
当我们登陆网页版的【讯飞极智】,SR702种的录音稿就会以音频+文档形式呈现,我们可以用电脑直接进行编辑,比如我录了一段名叫《关键问题》的废话文学,废话含量非常高,整段录音形成文字稿之后,点击右上角的【语篇规整】就会一键生成另一篇语句经过梳理的文案。各位可以打开下面的图片放大了看一下,确实通顺很多,比如第一句【不得不面对一个非常尴尬的事情】改为了【面对一个令人尴尬的问题】。这部分功能点对与文字工作者是有相当大的益处的,不仅可以修改错别字,还可以一键通顺整篇文章的语句,大大提高了工作效率。
另外还要提一个功能点,就是SR702在生成采访型文稿的时候,可以自动按照说话人进行区分,用一下谋女郎经典的采访桥段《嗯~,怎么不算呢?》
讯飞这个【区分讲话人】的功能太厉害了,我发现录得越多,AI越能分辨两个人声音的区别,到了web端还可以将讲话人进行名称修改,稍微整理一下,就可以出稿了。这次测试本身用的就是成稿采访片段,所以基本没什么口水词,所以我手动加了很多嗯、啊、内个、那啥这种口水词,在经过【语篇规整】之后都被消除掉了,非常强。
SR702第二项AI相关的功能点是【会议纪要】,主要是通过AI来摘要内容,可以【全文摘要】,也可以【分段AI摘要】。这也是现在AI的传统强项,我就经常把大段的文字输入AI,让其帮我整理有用的信息,效率极高。
还是试一下,让各位看一下星火认知大模型的落地效果如何,还是将刚才的《废话文学》拿出来试一下,这段文字我看了都挠头,说了几百字好像什么都没说,领导讲话有时候就是这样,让人抓不住重点。但在AI面前,都不是问题,AI仍然可以把【关键问题】浓缩成一段话。
刚才是一段不知所云的文案,用来折磨了一下AI,下面再试一下正经的科普文案,下面是描述温度与湿度的关系的一段800字的内容,点击全文摘要按钮之后,AI将内容整理成了100字以内。我想强调一下,这并不是粗暴的删掉多余的文案那么简单,而是理解文章描述的主要观点,然后将观点进行总结性输出,这是只有AI才能做出的总结功能。
刚才都是一篇文章的全文摘要,还可以实现分段摘要,官方叫【AI摘要】,其实就是选中一段文字,可以点击AI摘要,就会对这段文字进行总结。
还可以点击将【AI摘要】添加到右边,这样【对于全文的总结】与【你要重点关注的总结】都会集合在右边单独栏目中,整篇文章的重点一目了然。
我曾经用AI来写我家智能门锁的欢迎词,一下子写了十条,每一条都非常棒,AI在通顺语句,整理话术,总结方面都是非常强的,这些功能点在文案处理方面也是最落地的,正好也是音频转文案之后编辑环节最需要的。
曾经我以为AI就像比特币,就像网约车之类会红极一时,繁华落尽之后也只是人类历史上简单的一页篇章,但用得越多,看得越多,理解的越多越觉得AI不一样,AI是像计算机一样,可以改变整个人类生产方式的大创新,是一场暴风雨式的变革,对于AI听过最棒的一句话是:AI不会代替人,但使用AI的人会代替不会使用AI的人。也许未来我们使用各种设备都会像使用科大讯飞SR702智能录音笔一样,融入AI大模型,使用手机的交互方式会改变,我们写文章做视频的方式会改变,我们的智能家居物联网会彻底落地,未来,可期。
源码宝 2024-11-07
云舟生物 2024-11-07
开源之夏 2024-11-07