当前位置:首页|资讯|AIGC|AI大模型

保利威AI战略发布,一场AIGC引发的视频行业变革前奏|甲子光年

作者:甲子光年发布时间:2023-06-27

原标题:保利威AI战略发布,一场AIGC引发的视频行业变革前奏|甲子光年

未来,“智能”将贯穿视频行业,从创作,到运营,再到交互。

作者|刘景丰

编辑|栗子

自ChatGPT-3.5发布以来,AIGC如同打开了一扇创新之门,各种AI创新产品扑面而来:

能自主绘画创作的Midjourney,能自主修图的Generative Fill,以及不断涌现的对话大模型……

单单对ChatGPT,也已经有数不清的玩法,比如让它编程、写文章、整理速记、做PPT等等;乃至最近,有人用一段提示词,将ChatGPT-4变成了一个无所不能的AI论文导师。

这些AI应用展现出的各种新奇能力,让人们看到了AI大模型的巨大力量——无论是科技大厂、创业公司,还是各垂直行业的科技公司,都争相涌入AI大模型的研发和应用,以期通过“自我革命”的方式,在接下来的AI大模型时代找到立足之地。

尽管当下人们对AI大模型热情似火,但是各家几乎都聚焦于文本、图片等模态下的AI能力构建,将AI能力应用于视频的少之又少。

6月13日,企业视频头部服务商保利威在「AI· 重塑视界」AI战略发布会上,正式推出POLYV AI,将AIGC与视频直播结合,扩展出AI学习助手、智能数字人、智能会议纪要、智能制课、隐形溯源水印等多项AI新能力。

保利威相关负责人表示,AI大模型的能力在于它对内容的理解,以及对内容创作、内容生产带来的变革。这意味着,视频云厂商在提供产品的时候,可以将自己技术的能力、产品的能力,从视频播放延伸到视频的创作和运营上。

由此,直播也从交流传播形态,变成视频内容生产形态。

1.POLYV AI,一场对视频“从下到上”的整体变革

很多人都能感受到,我们的工作、生活,已经从过去的文图时代,慢慢进入到视频时代。

尽管相比图文,视频的表现形式更生动,承载的信息更多,但视频的缺点也很明显——受众只能以单向传输方式被动接受信息,且只能按照视频播放速度掌握要点;更重要的是,一条高频质量视频的制作成本极其高昂,对于预算有限的企业或个人而言很难持续投入。

有什么办法可以解决这些难题呢?

答案正是当下最火热的AIGC。

不久前,保利威举办AI战略发布会。智能音视频实验室主任、中山大学博士、保利威首席科学家丁一提到,ChatGPT最显著的特点是拥有更强的语言生成和理解能力。

他称,“保利威从2017年就开始对AI保持密切关注,并积极与中山大学、华南理工大学等知名高校联手,共同在语音识别、声纹识别、视频数据结构化、数字版权保护等领域深入研究。今年OpenAI的ChatGPT3.5掀起AI革命,各行各业的AI应用如雨后春笋般涌现。这场革命并不仅仅意味着‘更聪明的机器人',而是直接颠覆了人类与数字世界的交互方式。”

为此,保利威从今年年初便成立产品研发专项小组,与客户深入沟通场景应用需求,开发智能视频直播解决方案,并在5月起开放AI产品内测;这次,保利威正式推出POLYV AI。

一场视频行业“从下到上”的变革,就此打响。

其中,“下”指的是针对下游受众,POLYV AI的五大功能改变了人与视频之间的交互方式;而“上”指的是针对上游创作者, POLYV AI让一场视频交流或者直播,变成一个个按需定制的视频内容,彻底打破了视频创作的门槛。

先来看POLYV AI的五大功能,包括:智能大纲、AI学习助手、智能总结与纪要、智能数字人制课和隐形溯源水印。

在以教育场景为例,教学场景通常可分为三个阶段,课程生产、上课学习以及课后答疑。而人们接触最多的,是上课学习和课后答疑两个阶段。

针对上课学习,POLYV AI推出视频大纲智能生成功能。在视频教学、培训过程中,POLYV AI可以针对视频内容,一键生成包含章节大标题和段落小标题课程大纲总结,观看者无需浏览完整视频,就能从整体上理解视频内容的逻辑和结构。

POLYV AI还能将大纲中的每一个标题点,在对应着视频课程中打点,帮助用户在回看视频时快速定位到关键内容。

第二大看点是AI助手功能。AI可以像聪明的老师一样,将整堂视频课程内容快速识别、理解,然后帮助学生解答遗忘的知识点,并帮助学生提炼重点、提供个性化的学习建议,生成智能学习报告。这可以为学生和教师提供准确的学习数据和分析结果,对教学效果的评估和改进具有重要价值。

而且,AI助手的知识量,还可以随知识库内容的丰富而不断升级。

第三个看点,是针对课后答疑阶段的智能总结与纪要功能。当一场数小时的视频会议或者课程培训结束,很多人会觉得抓不住重点,出现“听完即忘”的情况。此时,智能总结与纪要功能,可以通过嵌入视频中的AI能力,自动对视频内容进行总结,自动生成会议纪要,并提炼出会议关键词,点击关键词还能快速定位到原文。

在实际场景中,这一功能还可以帮助会议迟到或者中途离场的人员快速了解整场会议内容,跟上会议节奏,提升开会效率。

第四个看点是智能数字人制课。这是AI在课程生产阶段的应用。保利威技术副总裁梁瑛玮在介绍中称,过去很多培训教材都是以一个静态的PPT形式存在,如果要将其转化为视频,需要专人重新制作,整个过程耗时数天甚至数周。但通过POLYV AI的AI制课功能,不到一分钟,系统就能自动识别PPT内的课件以及备注信息,并转为口播稿,自动生成教学视频;再配合预备好的数字人模型,就能自动生成一门课程。

而这个数字人,是可以按照企业需要或者制定的IP进行塑造的。它除了在视频中出镜外,还可以在直播中代替真人进行24小时不间断地直播,实现更多的价值。

第五个看点则是隐形溯源水印。过去,由于视频版权难以追溯,视频抄袭现象频发。

AI大模型作为一种巨量参数的算法,在极强的理解能力之外,还拥有高维特征处理的能力。这种高维特征的植入和识别能力,可以在视频版权保护中发挥作用。POLYV AI通过AI能力,将观看者的唯一ID带入到视频中。当发生视频被盗录的情况,版权方就可以根据ID信息追溯相关人员。

这五大功能,让过去冰冷的视频内容,变成了一个可以与人互动的数字生命体。用保利威CEO谢晓昉的话说,它改变了视频与人的交互方式,提升了用户的体验。

POLYV AI同样也驱动着视频行业创作方式的变革。

传统的视频制作过程往往较为繁琐,一个高质量视频的制作,需要在如PS、PR、AE等诸多重量级视频编辑软件间反复切换,视频的修剪、调色、配音和渲染更是要花费大量时间。

但基于AIGC的能力,就可以根据过去的视频语料快速生成新的视频。

谢晓昉以直播为例告诉「甲子光年」,一场直播结束后,会积累大量的视频素材,POLYV AI可以快速在其中提取视频金句、视频海报用于传播和营销。此外,POLYV AI还可以针对直播内容生成30分钟、5分钟、1分钟、15秒等不同时长的视频内容,为企业积累了大量的视频内容,并用于企业搭建自己的视频平台矩阵。

“这意味着,我们在提供视频云的时候,可以基于我们技术的能力、产品的能力,从视频播放延展到视频创作以及视频播放后的运营。”谢晓昉表示。“我们今天具备的AI能力,它不再只是解决单个问题的工具,而是变成了一个AI助理。”

除了视频内容生产外,AI也在改变着数字人的生产。

过去,数字人的制作成本高昂,制作一个高质量数字人动辄要花费数十万元、上百万元,而其后续的运营则要花费数百万元。而如今,随着数字人的渲染成本已经大大降低,语料的使用量也在减少,且制作过程中消耗的算力降低,这些共同驱动数字人的制作成本往下走。

与此同时,AI大模型未来将极大降低数字内容的生产成本,让数字内容的缺乏不再成为数字人运营难题。这也必然会加速数字人在各行各业中的应用。

2.十年迸发,高山之巅

从2013年保利威成立,到2023年POLYV AI的推出,保利威正在完成一场蜕变。

国内云视频行业的崛起是在2012年前后。彼时,4G刚刚开启,移动互联网大潮涌来,个人和企业对视频的需求急速增加。对网络视频行业敏感的创业者开始笃定,随着网络视频的日益普及,企业级客户的网络视频应用需求会逐步爆发。

而经营视频业务,需要大量的软硬件基础设施和升级维护投入。云视频SaaS服务按需租用的特点,既能大幅降低客户上线视频的成本,还迎合了客户在线视频应用的功能需求。

2013年,保利威视频云平台正式上线运营。此后,保利威开始为在线教育等行业客户提供视频云技术支持。

真正在行业打出影响力的转折点,是2016年。彼时,保利威拿下CCTV央视(微视APP)这个客户,并在此后连续6年为其提供直播技术支持。

在保利威十周年现场,CCTV微视技术总监绍伟细数保利威曾经服务的项目:“春晚、奥运会、大阅兵......我们携手度过了很多技术难关和问题,而保利威高并发能够接住大型项目的急速涌入的流量,也始终能够稳定交付。”

其中值得一提的是,2021年春晚是世界上首次在8K超高清电视频道进行的重大活动直播,来自俄罗斯、美国、法国等170多个国家和地区的600多家媒体向全球报道和呈现央视春晚的盛况。为提升VR全景视频收视互动体验,这一年春晚首次实现多机位VR沉浸声直播,在视觉和听觉上都呈现出三维空间感,打造出犹如身临现场般的视听体验。

而保利威首创的VR沉浸声直播也应用到这场春晚中,无论观众身处何地,只要打开视频,就如同身处春晚现场中央,不仅可以自由操控视频角度,还能听到来自身边所有方位的声音,喜庆热闹的节日氛围扑面而来、歌舞节目在“眼前”完美呈现,带来的震撼和冲击前所未有。

相比之下,彼时市面上主流的VR视频,虽然能够让观众任意操控角度观看,但声音仅仅是普通立体声(声音来自于前、后、左、右方位),和大家在真实环境中听到的声音仍然有差别,沉浸感一般。

得益于技术和体验上的优势,保利威也成为企业直播和视频需求的首选服务商。

2019年,保利威为建行大学搭建金融行业首个直播中台。建行大学将高频使用的功能模块整理出来,形成统一的直播管理平台,打通了内部业务管理,各项工作得到更好的协同落地。

截至2021年1月,保利威为建行大学搭建的网络直播平台取得了一系列斐然的成绩。3亿+访问人次、23901门课程、受训人次超100万人、7133本课本与图书、品牌外部媒体曝光量上亿次……建行大学在企业大学生态、组织体系构建、新金融+培训等各细分领域给业界树立了一个非常良好的范式。

疫情期间,许多企业面临线下沟通障碍,培训等业务推进困难。为此,保利威的直播平台便成为刚需。彼时,新华保险将员工培训由面授模式紧急升级为直播在线培训模式,通过内部学习平台“新华E学”,进行直播和班级管理。这一转变,不仅没有耽误培训业务进度,反而还提升了线上培训效率。

尽管疫情期间线上直播需求很大,但保利威的创新从未停止。为了让客户拥有更好的直播体验,2021年6月2日,保利威在无延迟直播产品发布会上重磅发布保利威无延迟直播(PRTC)产品,实现5大创新突破,将直播的延迟降至0.4秒内,给金融行业的直播培训来带全新体验。

这些努力,也得到了企业和社会的肯定。2020年,保利威获得中国互联网教育“停课不停学”突出贡献奖;2020~2022年,保利威连续三年获评“中国企业直播服务商排行榜第一名”;2021~2023年,保利威又连续三年获评“中国职业教育视频云服务商排行榜第一名”;而就在今年6月初,保利威因其在企业数字化方面的突出成绩,入驻中国信息通信研究院-铸基计划-企业直播专家委员会,参与直播行业应用标准的制定与推广执行。

尽管技术的优势让保利威赢得了客户的信赖,但仅靠视频技术无法构筑行业护城河。国内过去十余年的互联网发展证明,单纯的技术服务只是为客户提供了业务的基础设施,但真正能打动客户付费意愿的是服务和产品。

2022年3月,保利威发布“Service+战略”,将技术溶于直播服务——以直播+技术、直播+策划、直播+运营、直播+硬件,为企业提供全链路视频直播运营服务,构建企业视频直播体系。由此保利威完成了从视频技术服务商到视频运营服务商的转变。

而此次,随着POLYV AI的发布,保利威将过去十年积累的视频技术和服务能力与AIGC结合,让智能视频成为一类产品,从此改变了人与视频的交互方式,并极大提升了视频内容成产效率。

过去,当云视频还处在技术竞争时代,能力的同质化明显,似乎各玩家的护城河差异不大。但当行业进入服务和产品力竞争时代,一场由AIGC引发的云视频行业变革便正式打响。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1