在数字化时代,视频内容的传播与消费已成为日常生活的一部分。视频编解码技术是数字媒体领域的一项核心技术,它影响着视频质量,传输速度以及观看体验。与此同时,视频产业正在经历一场由技术驱动的变革,Sora、AIGC 等相关技术的兴起正是这场变革的关键推手。
本期 RTE Dev Talk,我们邀请到了 IEEE 1857.11 标准工作小组组长 刘东教授 在线分享“端到端图像编码技术与标准”,以及双深科技 CTO 武祥吉老师,声网合伙人、VP 孙雨润等大佬深入分析 Sora 技术在压缩算法、实时传输和跨平台兼容性方面的创新,以及这些技术是如何改变现有的视频编解码技术,以及影响未来的视频产业发展。
立即报名,和我们一同在线探讨 Sora 技术及其在视频编解码领域所带来变革的深刻理解,以及 Sora 及相关技术发展将如何塑造一个更加智能、高效的视频产业新生态。
时间:3 月 27 日(周三) 20:00 - 21:00形式:线上直播
20:00 - 20:20 主题分享:端到端图像编码技术与标准
20:20 - 21:00 圆桌讨论:Sora 在视频编解码领域的突破与革新
中国科学技术大学特任教授,IEEE 1857.11 标准工作小组组长
刘东
端到端图像编码技术与标准
个人简介:
刘东博士,中国科学技术大学信息科学技术学院电子工程与信息科学系特任教授、博士生导师、系副主任,获得国家自然科学基金优青项目资助。2004 年、2009 年在中国科大分别获得学士和博士学位。2009 年至 2012 年任职于诺基亚北京研究院。2012 年至今历任中国科大轨道制副教授、副教授、特任教授。研究领域为图像视频处理、编码、分析和数据挖掘。在国际期刊和会议上发表论文 200 余篇,谷歌学术总引用超过 16000 次,h 指数 50。获授权发明专利 30 余项,多项技术提案被国际国内标准组织采纳。现为 IEEE、中国计算机学会、中国图象图形学学会高级会员,IEEE 电路与系统学会多媒体系统及应用技术委员会委员,中国图象图形学学会多媒体专业委员会常务委员。任 IEEE 1857.11 标准工作小组组长,IEEE TIP 期刊副编辑等。
分享内容简介:
各种各样的应用场景中每天都在产生大量的图像数据,AIGC 的兴起更是加速了图像数据的爆发式增长。海量数据给存储和传输带来巨大压力,迫切需要图像编码技术对数据进行更高效的压缩。
近年来,人工智能和深度学习被运用到图像编码中,产生了端到端学习的图像编码技术,其核心思想是利用神经网络构建编码器和解码器中的计算单元,并利用率失真函数对整个网络进行整体优化。端到端图像编码技术从 2015 年起步,现在已经表现出相比传统技术的显著优势,但也提出了计算复杂度过高等挑战。国内外研究人员不断寻求更新更好的端到端图像编码技术,并合作制定了新的图像编码标准,例如 IEEE 1857.11 和 JPEG AI 等。
此次分享将简要介绍端到端图像编码技术的核心原理、当前水平以及相关标准的最新进展,并讨论下一步发展趋势等。
上海双深信息科技 CTO
武祥吉
2017 届浙江大学硕士毕业,国内最早从事 AI 编解码研究的一批人,在 CVPR2019/2020/2021 图像视频编码赛道中,获得多次世界第一。与团队一起参与制订 IEEE 1857.11 AI 端到端图像编码标准, 贡献了一项适合 NPU 并行计算的熵模型加速专利。
神秘嘉宾
RTE 开发者社区布道师
孙雨润
个人简介:
孙雨润,RTE 开发者社区布道师,声网合伙人兼客户成功副总裁。毕业于中国科学技术大学计算机专业,曾先后供职 YY、微软、腾讯。2014 年加入声网,是早期创业团队成员之一,目前主要关注电商/秀场/赛事/游戏/元宇宙等赛道,通过实时互动能力,推动相关场景体验提升、技术迭代、商业闭环。
扫码添加小助手微信,备注「0327」进活动群
通过本次活动,我们希望帮助各位小伙伴了解背后的技术,并且结交相同兴趣的志同道合的朋友~扫码进群,还可以和本次活动的嘉宾交流沟通哦!