科大讯飞副总裁,听见科技总经理 王玮
9月11日-14日,由钛媒体与ITValue共同主办的2024 ITValue Summit 数字价值年会在三亚举行。会议由钛媒体集团、ITValue联合主办,此次峰会主题为“Ready For AI”,交流经验教训,交叉行业思考,推动创新交易,以创新场景为基础,共同探索AI驱动下数字经济时代的全新机遇,共同打造一场数字经济时代的AI创新探索盛宴。
大会首日,科大讯飞副总裁、听见科技总经理王玮以“AI+SaaS,开启智慧办公新生态”为主题发表演讲。
王玮表示,AI 大模型正与每个人息息相关。不管是医疗、会议,还是物流等领域,以大模型为核心的生成式 AI 技术正在帮助人们提质增效。从语言到认知,讯飞听见是办公场合的应用利器,目前讯飞听见在智能语音转写工具领域排行第一。
“我们希望,讯飞听见能够成为你随身的语音记录助手,不仅能够记录,而且还能把文字进行提炼,帮你归纳整理做待办。”王玮指出,大模型技术促使SaaS智慧办公服务实现更多的落地商业应用。
据悉,讯飞智慧办公SaaS平台,是科大讯飞推出的智慧办公综合网站。以SaaS办公产品为核心,融合科大讯飞旗下多款智能硬件,为用户提供全面、便捷、智能的AI办公产品及服务。核心的SaaS产品主要包含讯飞听见、讯飞同传、讯飞写作、讯飞会议,基于AI能力帮助用户从记录、沟通、创作、协同工作流中提效,创造新质生产力。
2010年,随着讯飞语音输入法验证了讯飞专攻的语音技术的市场规模以及商业化价值,讯飞在商业化产品探索中,决定开启做为技术付费的产品,商业模式当下最适配以及市场校验最快的赛道就是SaaS。
2015年,科大讯飞上线讯飞听见转写网站,并正式对外发布正式版讯飞听见产品家族,依靠19.8元/小时的转写服务,网站上线半年后获得100万用户。成为中国SaaS产品市场上最早的一批付费工具产品,并且一路发展到今天成为中国智能语音转写领域第一。讯飞同期还发布首款录音笔。
讯飞智慧办公SaaS 平台是讯飞战略发展中的重要一环。截至目前,讯飞智慧办公SaaS平台报告期内生态用户超过2亿,覆盖用户超过7500万,2024年平台升级后聚合讯飞旗下多款智慧办公硬软件产品,用户可实现讯飞办公产品的一站式选择和使用,随星火大模型能力搭载后,讯飞写作新增付费用户数超1240%,平台整体付费用户数超20%,并与中国电信、中国工商银行等企业达成合作,助力千行百业 AI 提效。
同时,讯飞听见层面,目前是智能语音转写第一品牌、手机应用商城效率转写排行第一,也是业内最早起家做智能语音转写和付费SaaS的产品;讯飞同传层面,其已经为数十家世界500强企业持续提供AI同传服务。公有云业务上,讯飞同传新增注册同比增长168%。
此次演讲中,王玮坦言,AI 讯飞星火加持的应用可以让每个人可以更加美好,为这个社会做更多的帮助,在中间要找到值得期待的地方。
王玮强调,未来,AI 技术一定会对传统千行百业进行变革。随着新技术、新产品、新产业不断变化,讯飞会找到新的方向和位置。科大讯飞坚持“软硬一体”,尤其拥有自主可控、底层算力、算法、国际格局,有源头的技术生态,利用星火大模型智能体与场景业务对接,形成软件+硬件+服务的讯飞SaaS生态,让 AI 赋能千行百业。
以下是科大讯飞副总裁,听见科技总经理王玮演讲内容整理:
非常荣幸今天受刘湘明总的邀请来到美丽三亚,今天的开场既轻松又活泼,而且更加有内涵。所以我就在想,我今天用什么样的一种风格跟大家做交流。
大家可以看到,近两年,不管是做IT,还是做人工智能(AI),都不得不说“大模型”这三个字,不说好像就已经Out了。
2023年10月,Gartner发布2024年十大战略技术趋势,到2026年将有超过80%的企业使用生成式AI。而谷歌CEO桑达尔·皮查伊(Sundar Pichai)透露,当前有超过35%的企业已经在利用 AI。
因此,AI 大模型正在与每一个人息息相关。
不管是我们听到的医疗领域,还是物流领域,大模型、生成式 AI 到来之后都和我们产生的关系。
如果你是一名职员在一家广告公司里,还要想想做记录,现在有一些耳机已经帮你转成文字,甚至还给你做了纪要。尤其,现在一些客服人员在 AI 的辅助下效率得到极大提高。
如果你是一名程序员,生成式 AI 到来之后,这些类ChatGPT产品可以做对话、搭网站,一定程度上替代原来我写代码。因此,科大讯飞内部的程序员都有利用 AI 进行辅助,原本花三个月开发的工作,现在一个月就可以完成,甚至整个测试代码也开始用 AI 不断做改变。当然,有一些核心的代码还需要一些高端的算法工程师自己编写。
实际上,生成式 AI 到来之后,对媒体行业也有颠覆式改变,以前我们都要自己写,现在我搭一个框架,是不是可以让AI帮我改写、缩写、扩写,甚至是润色。我们自己也有一个讯飞写作,很多网络小说家如今也开始让大模型对话,辅助它创作,现在有很多的追更小说已经用大模型进行配合。
大模型已经到来以后,改变了我们(生活中)的方方面面。从去年开始,科大讯飞一步步不断迭代讯飞星火认知大模型,这个大模型是在完全自主可控的底座上面去做的。去年说“百模大战”,大家都在讲故事说概念。而科大讯飞是唯一一家不仅讲故事,而且还按照时间节点做,一个个都能落地的企业。
今年1月30日,我们完成了在全国产化算力底座上的万卡集群;6月27日,我们正式发布了星火4.0,增加了一些多模态交互和使用能力,现在已经全面对标GPT-4 Turbo。而且,现在讯飞也参加到大模型测试单位,整个公司都围绕生成式 AI 构建底层算力、中间算法和数据、上层应用的生态。
然而,我们也同时感受到,一轮一轮发展后,大模型让一脚油门踩下去到了80%,但回头一看,几个亿没了,进入到下半场是怎么落地、怎么应用。
科大讯飞成立至今已有25个年头,我们是平台+赛道,包括一个通用能力的底座模型,上面则赋能各行各业进行应用,比如教育、医疗、工业等场景。在工业方面,我们现在有很多“工业黑灯工厂”,而且讯飞和中国石油、中国移动共同发布行业大模型。很显然,AI 已经在各个领域都进行了应用。
下面我想跟大家分享办公领域的应用。
实际上,办公是我们在整个业务线中比较通用的领域。在2015年之后,我们发现办公室当中大家要经常开会,而开会的时候希望把每个人的讲话都能记录下来,因此,以这个需求为依托,我们打造了语音转文字技术,并且发展成为平台和商业化。我们并没有走完全的C端路线,而是在相对垂直领域里提供付费订阅模式,现在已经成为国内头部办公服务平台之一。不管是听见、写作,还是同传、会议,讯飞开始打造出一套SaaS办公平台。
核心层面,首先是 AI 和语言。语言的背后是数据,哲学家说“语言即世界”,你听到的、表达的内容是你的观点。因为讯飞从起家就开始做语音识别、语音合成。因此,无论是识别,还是合成,讯飞听见做的是感知智能。而到了写作,大模型做的是认知。
从语言到认知,讯飞听见是办公场合的应用利器,同时还是在智能录音工具领域排行第一,大部分人是一线年轻人,有一些大学生、留学生学习时一边听老师讲课,一边记录下来。我们希望,讯飞听见能够成为你随身的语音记录助手,不仅能够记录,而且还能把文字进行提炼,做代办。
其次,有了这样的语言记录之后,下一步做什么?做出海、要沟通,有很多同传和翻译需求。另外,现在文旅非常的火,包括今年上半年放开入境之后,在沟通、导览方面都能看到讯飞的翻译技术,而且讯飞的翻译机卖得不错,还有导览大厅上都已经在落地使用了。
再次是写作。讯飞目前还有 AI 写作产品。相比其他产品,讯飞写作的优点在于,有语音素材可以一键导入,以前有一些生成式 AI 写作需要人进行辅助,因为大模型还有最后1公里、幻觉等问题。但讯飞写作借助已有素材或已有溯源内容再去写作,而且图文并貌,从而让你的写作更加事半功倍。
最后是会议。讯飞既然做办公,尤其三年疫情形成线上会议,而疫情后,这种跨越式的和视频的交流已经变成生活的习惯,在会议背后有很多同传翻译、提炼、写作等工作,而且会议还可以潜入办公中、远程医疗等场景。
所以,利用大模型技术进行业务和场景结合,形成软件+硬件+服务的生态,构建了讯飞办公,尤其是讯飞SaaS办公的应用。
说完应用落地,和大家分享一下现在一些场景应用。
首先,我们在两会、香港立法会都参与其中,包括提供 AI 翻译、同传等功能,港府的立法会所有的开会最后的信息都在网上公开,对外输出的数字增加了一倍以上,现在我们也积极的进入到第三期,用大模型帮他做沟通,或者是发布,帮他做一些辅助立法的工作。
不仅如此,科大讯飞还是冬奥会和冬残奥会的翻译技术提供商,去年亚运会,我们还和央广进行合作。而今年刚结束的巴黎奥运会,我们也用 AI 技术提供同传服务,促进赛事、大赛无障碍交流。此外,也有很多世界500强公司开会时也使用讯飞同传服务。
而会议层面,截至目前,累计有500万间的 AI 会议室,包括政府和大型企业。现在我们也特别希望把这样的应用让更多的人用起来,现在我们也在加大SaaS平台服务力度,也在让更多的消费者使用。
钛媒体有一句话,大模型到来之后,AI 时代让大家人人平等,都能使用到。而讯飞也是这样的理念。
在国内,听障人士有2000万,国际上更多,所以讯飞听见发起了 AI 声音,免费把我们的应用开放给中国听障人士,只要上传了二代听障证书就可以免费使用。现在很多听障人士是识字的,我们给听障人群捐赠定向1亿分钟,用了这样的设备之后,可以正常的交流。
人工智能来了以后,为不能而战的人战斗,每天这种感动的故事在发生。我们也相信,在人工智能的加持下,它可以让每个人可以更加美好,为这个社会做更多的帮助,我们在中间要找到值得期待的地方。
未来,随着 AI 技术不断发展,一定会对传统行业发生变化。我觉得人最好的是学习力很强,会随着新技术、新产品、新产业的变化后,我们会重构,每个人找到新的方向和新的位置。我们坚持软硬一体,尤其是底层算力、算法、数据,都是自主可控、国际格局,中美在硬科技上的加持对抗之外,我们一定要有源头的技术生态。而且,大模型来了之后,现在我们还需要有各种各样的智能体,跟场景业务进行对接,赋能各行各业。
以前我们讲,“互联网+”,或者是“+互联网”。现在是“人工智能+”,或者是“+人工智能”,或者是“大模型+”、“+大模型”,技术不仅是技术,还是要落地,最后是重塑和繁荣整个行业生态。
从古老的行业开始,语言是民族的象征,而一种新的 AI 技术正在重塑语言这个行业。最后希望我们携手共建,共同繁荣生态,用最新的技术一起迎接美好的未来。谢谢大家!
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)