当前位置:首页|资讯|人工智能|大语言模型

“郭德纲秀英语”视频如何鉴伪?京企新产品用AI打败AI

作者:北京日报发布时间:2023-11-08

原标题:“郭德纲秀英语”视频如何鉴伪?京企新产品用AI打败AI

最近,在互联网视频平台上,相声演员郭德纲说起了流利的英语,这段能以假乱真的视频,其实是通过人工智能(AI)技术生成的。与此同时,“AI换脸”等新型诈骗形式也开始出现,引发了公众的担忧。北京科技企业瑞莱智慧最新发布的生成式人工智能内容检测平台DeepReal2.0,可以轻松识别人工智能生成的图像、音视频及大语言模型生成的文本等,让其无处遁形。

利用人工智能技术生成的“郭德纲”能用英语说相声,神态、动作、口型都宛如本人,而视频右上角的一行小字“本视频由AI生成”,引得不少网友发出感叹,“人工智能技术太可怕了,不单声音很纯正,就连嘴型都无可挑剔”,“太自然了,差点儿以为是真的”。

这类视频的底层技术属于深度合成的技术分支——口型驱动,也就是对人脸信息进行局部篡改,当人工智能模型的训练数据量足够多、方法不断优化,生成的视频用人眼已经难辨真伪。对此,有网友表达了自己的担忧:“能让郭德纲讲英语,还有什么视频做不出来?”

“魔高一尺,道高一丈”,人工智能技术伪造的视频,也可以通过人工智能技术加以鉴别。“我们建设的生成式人工智能内容检测平台,就是要‘用AI打败AI’。”瑞莱智慧高级产品经理张天奕介绍,常见的“换脸式”生成视频,一定会存在与真实拍摄不符的痕迹,或出现与常识不符的动作、行为等。检测平台同样借助人工智能技术,在不断学习各类可疑视频的过程中,逐渐掌握识别的窍门,哪怕是细微的像素级篡改痕迹,也逃不过平台的“眼睛”。

瑞莱智慧在2023年世界互联网大会上发布生成式人工智能内容检测平台DeepReal2.0

利用学术数据集与主流网络数据集进行测试,该平台的检测准确率已达到99%以上。它的“实战”成绩也相当突出,对图像、视频、音频等生成式人工智能内容检测准确率,已达到国内外业界的顶尖水平。同时,平台还在探索对大语言模型生成文本的识别,不断提升检测的准确率。

目前,该平台主要服务于政府监管及商业平台需求,尚未对公众开放。前不久出台的《互联网信息服务深度合成管理规定》,明确要求深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识。张天奕表示,公司也在协助相关部门探索更优的标注和识别方式,保障相关技术在法律框架内的有序发展。

随着人工智能技术的发展,平台也将持续跟进并研究新的伪造检测技术,明确真伪的边界。“伪造技术和破解技术的攻防交替升级,是必然的过程。”作为人工智能行业从业者,张天奕认为,人工智能兼具建设性和破坏性的“双刃剑”效应,高水平的安全,是人工智能高质量发展的前提,最终需要从模型算法的原理上加以突破。

【相关链接】

遇到疑似“AI换脸”诈骗怎么办?

问:一通视频电话打来,对面的“亲朋”却可能是人工智能生成的图像,如何才能准确识别“AI换脸”诈骗?

张天奕:用生成式人工智能模仿受害人身边的亲友,诈骗者能获取的样本数量是有限的,可以通过延长通话时间、多次提问等方式让视频中的“人”多说话,对方便更容易露出破绽。如果诈骗者的技术水平较弱,引导对方做大幅度摇头、张嘴等动作,就能暴露出面部边缘、牙齿等部位的瑕疵;在声音伪造方面,可以尝试用方言交流。不过,这些技巧对于识别“高水平”的不法分子依然存在难度,建议可以辅以询问亲友间小范围知悉的信息,进行身份核实。

问:怎样才能防止个人信息被不法分子利用?

张天奕:生成式人工智能的“原料”就是个人的音频、视频、图像。大家一定要注意保护自己的面部图像、声音等个人信息,特别是高清的照片、视频,建议不要在公开平台发布,降低被盗用的可能。

来源:北京日报客户端 记者:刘苏雅


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1