AI诈骗肆虐，平台如何做好AIGC风险管理？

作者：数美科技发布时间：2023-06-19

老牌歌星合唱的梦幻联动，实则是AI合成音频，但可达到以假乱真的地步；某男子因遭遇AI换脸骗术，9秒被骗245万；某带货直播间，使用AI换脸黑科技，粉丝误以为当红女明星直播带货......

随着AIGC的爆火，给予冲浪选手们更新奇体验的同时，以AI实施犯罪的团伙也猖獗在互联网中，威胁着公民的信息安全、财产安全及知识产权，危害着全民网络健康。

AI诈骗肆虐，为什么心有戒备仍会上当？诈骗的底层逻辑是什么？平台应该怎么防范，才能做好AIGC风险管理？

AIGC审核：生成端与发布端

一、AIGC生成端：模型输入和用户输入审核

AIGC，利用模型生成的海量内容，本身就是在AI与人的互动中生成内容。面临的最大挑战是模型生成的内容不可控。AIGC宛如一个巨大的“黑箱”，在人与AI的交互中，可能生成存在侵犯他人利益的内容，如敏感言论、违禁内容、AI假脸合成等。因此需要做好审核预案，主要审核方向为模型的输出及用户的输入。

对模型训练语料进行过滤：由于AIGC生成的内容是自动化的，在前期对模型进行训练时，就需要对可能生成敏感、违禁类的词汇进行审核和过滤，降低AI输出内容的风险。帮助模型在给用户生成内容之前，进行一轮审核，确保模型生成的内容合规。

对用户输入内容进行审核：在对模型的训练语料进行过滤之后，相对于在前期加上一层滤网。但对于用户五花八门的提问，并不能保证输出的内容完全合规。数美风控审核使用诈骗识别模型，联系用户提问的上下文，识别潜在犯罪分子利用AI进行诈骗的套路和话术，并进行拦截。

二、AIGC发布端：风险内容和风险账号审核

从AIGC生成端流出的内容，通常会被发布到内容社区、直播社交等平台。由于AIGC生成的内容过于仿真，用户无法用肉眼去判别是否为合成内容。内容社区和AIGC内容输出端需要进行审核确保生成的内容合法，并且不会对用户和社会造成负面影响。对违规内容的识别主要有两个方面：

内容层面。内容模态如视频、图片、文本、语音内容，体量庞大且内容多样。在审核环节，可以采用人机协同的方式，先用敏感词、模型等方式尽可能把有风险的内容识别出来，将风险内容交由人工二次复审，对于最终判定无风险的内容进行发布。

用户账号层面。对于潜在犯罪分子存在“内容逃逸”的状况，需结合发布内容和账号，综合判定是否为AI诈骗。数美天网风险决策引擎，精准识别伪冒、交易欺诈等账号行为风险，输出实时的风险决策建议，同时也会返回账号风险标签，提供完备的业务行为保护。

AI诈骗审核难点

AI诈骗的成功率之所以可以达到100%，正是利用了“熟人效应”，通过换脸，让受骗者误以为是熟知之人，从而受到欺骗。

AI换脸基于深度学习技术，核心是一个“自动编码器”，它能够接收数据输入，并将其压缩成一个小的编码，然后从这个编码中重新生成原始数据，在其中合成诈骗分子所需的“诈骗原料”，即技术处理之后我们看到的“伪熟人”。

AI诈骗审核的难点在于，诈骗手段多样化，且不断变化，使得传统的规则和算法很难完全捕获这些骗局。此外，诈骗分子也会不断采用新的技术和手段，比如语音合成、自然语言生成等技术，其行骗的话术和套路也随着审核的升级而迭代。

另一个难点在于，AI算法对于特定领域的数据处理有限，需要不断优化审核模型，为了应对诈骗手段的变革，AI算法需要拥有灵活多变的处理方式，能够快速识别和处理不同类型的诈骗情形。

对于大量“伪装”的诈骗内容，光靠用户凭借经验识别，想必困难重重。需要平台使用人工智能技术辅助审核，比如使用自然语言处理技术来检测生成的声音是否包含不当言论，利用图像识别技术来检测生成的图像是否违规。平台及时对用户进行“反诈骗”提示，在用户真正受骗之前及时布防。

此外，还需要建立完备的人工审核机制，提升审核人员的专业素质，保证审核流程的规范化，来确保审核的准确性。

数美科技：护航AIGC行业健康发展

数美科技作为在线业务护航专家，深耕风控技术近7年，在AIGC内容审核方面，深度融合AI智能审核与人工审核优势，为企业提供模型效果持续迭代、数据高度可视化、风险动态实时同步的人性化人工审核平台，实现文本、图片、音频文件/直播、视频文件/直播的全栈式智能内容审核。

一、智能文本检测：融合多种NLP技术前置布防

将 FSA 算法应用于变体识别，布防更前置，有效防御试图绕过规则的各种变体广告、变体违规文本等深度融合 Fasttext、HMM、CRF、Word2Vec 等 NLP 技术并不断革新，准确率高达 99% 以上。

支持表情符号形态的文本识别，让变相辱骂、广告导流等信息无处躲藏。根据地区监管政策差异，本地化部署风控策略，支持175种语种检测和18种主流语种风险标签识别。

二、智能图片检测：深度融合多项模型组合训练

以海量图片样本库推动模型迭代更新，实时应对审核需要；具备物品库、动物库、明星库、深度融合Inception、ResNet、MTCNN、InsightFace、EAST、CRNN等模型，多模型组合训练，精准识别各类违规图片。

场景库等特色样本储备。精细化标签体系结合简单易用的策略配置方法，可适配多行业的个性化审核需求，更能及时应对突发事件或临时性监管要求。

三、智能视频识别：实现最长响应时间1s的超高实时率

视频识别实现毫秒级迅速响应，视频过滤最长响应时间1s，处理实时率可达30%。深入每处细节；内容识别维度广，360度同步检测视频画面出现的画面、声音、字幕、文本、弹幕等内容。

相关资讯