“在‘通义千问’大模型发布时我们就说过,要把以前做过的工作都用大模型来重新做一遍。”阿里云智能CTO周靖人表示,“我希望大模型能给大家带来新的机会、新的挑战,希望各种APP、各种业务场景以及各种业务系统,都因为大模型的到来可以重新做。”
6月1日,阿里云宣布通义系列大模型的最新进展:AI大模型“通义听悟”正式上线并开放公测。用户在公测期间可领取100小时以上的免费转写时长。
“通义听悟”具有10余项AI功能,能够极大程度地提高知识从音视频形式转变为图文形式的效率,比如音视频实时转录及翻译、一秒总结长篇视频的核心内容等。
具体来说,该产品拥有实时记录/翻译、发言人区分、全文摘要、云盘文音视频一键转录、待办事项、字幕下载、中英自由说等多项核心功能。
那么,这些功能究竟应该被如何应用呢?
当我们在看直播或英文纪录片时,当我们正在参加工作会议却有事外出时,当我们需要撰写一篇文章却不想打字时,可以使用“通义听悟”的实时记录/翻译功能,实现英文内容的实时转录和翻译、会议内容的全程录音和结束后的要点整理,以及用口述让AI实时记录和整理长段内容。
当参加一场多人讨论会议时,常常需要快速厘清多人讨论中每位发言人的讲话内容。在这种情况下,基于“通义听悟”的发言人区分功能,可以快速实现不同人物发言的自动区分。
当需要学习来自长篇视频内容的知识时,可以利用“通义听悟”的全文摘要和章节速览功能,实现核心内容的一秒总结和视频时间轴的生成。该功能不仅能将万字长文缩短至200字的概要,还能根据文字内容直接对应到视频时间点,方便使用者回看原视频内容。
现在,就让我们来通过一个具体的案例,测试一下“通义听悟”的音频翻译功能。
首先,我们登录“通义听悟”的官网(https://tingwu.aliyun.com/),将一个时长超过30分钟的目标音频文件进行上传,并根据音频内容选择所要转写的语言和发言人区分。
点击“开始转写”之后,我们可以看到,“通义听悟”在两分钟以内便完成了对全部内容的转写。
点开转写页面,可以看到由“通义听悟”自动生成的包含关键词、全文概要、章节速览,以及区分了发言人的全文内容。这不仅有利于我们快速掌握音频文件中的重点内容,还能帮助我们根据实际需求快速定位想要获取的核心信息。
此外,值得一提的是,在页面的右边不仅留有可以编辑的区域,方便我们在听录音、看内容的同时,记录核心要点和所思所想;“AI发言总结”功能还能将两位发言人所表达的内容进行一个简要清晰的总结。
除了上述功能之外,“通义听悟”还即将上线Chrome插件、内容问答和提取PPT等功能。拿Chrome插件来说,只需打开Chrome插件双语悬浮字幕条,外语学习者和听障人士就可以随时随地观看无字幕视频。
正是这些核心功能,帮助“通义听悟”达到了“听力好、悟性高”的水平。而在这些功能的背后,也离不开语音识别、大模型摘要及对话能力和多说话人识别等关键技术的支撑。
据悉,目前“通义听悟”已经完成了与阿里云盘之间的打通,云盘上音视频内容都可实现一键转写。公测期间注册的“听悟”用户,还能在后续获得更大的阿里云盘存储空间,并享受在云盘内在线播放视频时自动弹出字幕的功能。
据介绍,该产品目前公测的是个人版,下一步阿里云计划推出企业版本。基于不同的企业存在不同的需求,也有数据安全和隐私等方面的要求,企业版本将真正根据企业的场景进行定制,并开发完整的产品系列。
通义听悟技术负责人鄢志杰表示:“我们想把这款产品定义为我们工作和学习中一个提效的助手,它的定位不含任何替代人的部分。”在与具体的垂直领域进行结合时,它能够帮助对应的领域完成记录、沉淀和分析,进而帮助企业更好地决策和经营。
同样在6月1日,阿里云公布了其扎根粤港澳数字经济发展成果:已经服务了粤港澳近75万付费客户。
据介绍,在推进大湾区产业数字化建设的进程中,阿里云已经深耕多年,在香港、澳门、广州、深圳等地都设有团队,服务范围覆盖金融、政务、制造等多个行业领域。
比如,在金融领域,已经服务了包括招商银行、中信银行(国际)、恒生银行、广发银行等在内约90%的大湾区银行客户。
在制造业领域,不仅帮助美的、VIVO、小鹏汽车等企业实现云上创新,还帮助日化、小家电、玩具等广东特色产业集群实现降本增效,支持上云制造企业超过500家。
与此同时,需要说明的是,对于背景相对特殊的大湾区来说,其业务可能涉及到数据出境的问题。在这个方面,阿里云一般如何处理呢?
阿里云智能港澳地区及菲律宾总经理刘彬星表示:“首先,数据出境完全遵循国家法律法规、工信部和网信办的法规。在基于法律法规的前提下,我们为客户提供基础设施方面的能力服务,包括跨境线路及网络能力。”
此外,在本次大会上,阿里云还携手各行各业的多家生态伙伴,共同成立粤港澳大湾区数字经济创新发展联盟,共同推进千行百业向数字化和智能化方向迈进。
作为粤港澳大湾区的核心城市,广州是中国经济体量最大,也是活力度最高的区域。
阿里云智能中国区副总裁、广东分公司总经理张涛表示:“我们发现这边很多大的企业非常有前瞻性,并且非常务实。这些企业本身对数字化的理解也非常深刻。所以,我们阿里云在通过和这些伙伴合作的过程中,也是反向进一步要求我们提供更好的产品和更好的服务。”
为加大在广州的投入力度,服务广州高质量发展,阿里云与广州海珠、白云和南沙三区建立合作。具体来说,其与海珠区合作共建智慧城市新型算力基础设施;与白云区合作推动新一代人工智能算力产业生态建设;与南沙区和中航云共建粤港澳跨境出海产业数字底座和高水平产业数字化发展平台。
一直以来,阿里云智能都在不断丰富其AI服务,致力于通过全栈技术来推动千行百业的AI发展和应用。
在基础设施层面,提供GPU、FPGA、ASIC等多元异构计算实例。在此基础之上,提供支撑大规模训练的灵骏智能计算集群,以及支撑大规模推理的弹性计算ECS集群。
对于那些有自行开发模型需求的用户,阿里云智能提供覆盖全生命周期深度优化的机器学习平台PAI,其中包括Notebook交互式AI开发编程环境PAI-DSW和低代码开发环境PAI-Designer等。而对于那些希望直接使用模型或进行简单二次开发的用户,则提供通义基础大模型和以之为基础的企业专属大模型,帮助泛AI开发者降低模型开发和应用的门槛。
此外,为给各行业客户赋予融合了行业场景的AI能力,阿里云还提供了城市大脑、工业大脑、医疗大脑等产业智能领域的解决方案。
为了加快突破AI应用的难题,围绕模型搭建相应的服务体系非常重要。在2022年云栖大会上,阿里云在业界首次提出了“Model as a Service”(MaaS,模型即服务)概念,希望通过降低AI开发和应用的门槛,将AI模型变为直接可用的服务。不仅如此,还联合生态伙伴共同发起了AI模型社区——“魔搭”。
该社区于2022年11月上线,目前拥有160多万活跃用户,开放开源900多个优质AI模型,模型下载总量超过2500万次,已经成为国内规模最大的AI模型社区。
在本次阿里云峰会现场,“魔搭”社区宣布举办首届AI编程马拉松挑战赛,并面向全球的AI开发者和初创团队发出邀请。
该赛事要求参赛队伍以AI模型为中心,基于生产生活中面临的具体场景开发创新应用。参赛队伍既可以使用“魔搭”社区为其提供的用于模型训练推理和demo部署展示的免费资源,也可以使用其他AI模型。
据介绍,报名参赛时间为从即日起至6月25日期间,主办方将在对报名信息进行综合评估之后公布入围名单,并于7月举办线下赛。参赛队伍需在两天时间内完成产品开发,第三天进行现场路演。
据悉,本次大赛的颁奖典礼将于7月举办,胜出队伍最高可获得3万元人民币奖金,并有机会共享顶尖投资机构提供的千万美金风投资金池。
在推进各行各业实现数字化转型的过程中,AI本就发挥着十分关键的作用。大模型的出现和其所具备的强大能力,又让我们再一次深刻感知到AI改变生产生活的潜力。有了大模型的加持,相信未来千行百业都有望迎来颠覆性的发展和创新。