当前位置：首页|资讯|人工智能|清华

给大模型系上“安全带”，瑞莱智慧发布全新人工智能安全平台

作者：南方都市报发布时间：2023-07-09

人工智能清华

新技术的出现往往伴随着新的安全问题。大模型作为当前人工智能领域的热点之一，其强大的能力引发了学界和业界的关注和忧虑。近期，包括机密文件泄露、违法有害内容的生成以及对某些社群的偏见和歧视等安全问题，频频曝光。

如何助力大模型安全发展？清华大学人工智能研究院孵化企业瑞莱智慧RealAI，日前推出了一款人工智能安全平台。

7月7日，南都记者获悉，瑞莱智慧在2023WAIC世界人工智能大会发布了全新人工智能安全平台RealSafe3.0。

据称，RealSafe3.0为大模型提供了端到端的模型安全性测评解决方案。相较上一版本，RealSafe3.0在评测维度上进行了全面升级，涵盖了近70个评测维度，包括数据安全、认知任务、通用模型特有漏洞、滥用场景等。该平台的工作流程包括通用大模型的测评和优化，通过自研红队对抗模型和教练模型，从源头上修复模型中的问题，提升安全性能。

瑞莱智慧联合创始人、算法科学家萧子豪认为，大模型“落地难”的本质在于，当前仍处于“野蛮生长”阶段，还没有找到场景、风险和规范三者之间的平衡点。而在探寻这一平衡点的过程中，缺少易用和标准化的工具，即在技术层面上缺乏有力抓手，能够科学评判大模型在场景中能否同时满足规范和低风险，且能够进一步定位问题并给出优化建议，助力模型上线运行。

除了RealSafe3.0，瑞莱智慧RealAI还发布了能够防范生成式人工智能恶意滥用的DeepReal2.0。DeepReal可以检测Deepfake内容，并新增两个功能模块，用于检测Diffusion和LLM生成的数据，支持对图像、视频、音频和文本的伪造检测。该平台的应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等，可对生成式人工智能技术滥用行为进行管控和治理。

萧子豪表示，未来瑞莱智慧将继续致力于技术创新和产品优化，确保在人工智能安全的攻防战中始终处于领先地位，为人工智能的高质量发展贡献力量。

采写：实习生伍晓倩南都记者黄莉玲

推荐体验

相关资讯

给狂飙的大模型系上“安全带”，瑞莱智慧发布全新AI安全平台RealSafe

近几个月来，以ChatGPT为代表的生成式人工智能狂飙突进，大模型时代已然降临。和所有通用目的技术一样，自人工智能诞生的那一刻起，创造技术的力量和控制技术的力量就存在不对等。

ChatGPT 人工智能

砍柴网 2023-07-11

瑞莱智慧发布全新AI安全平台RealSafe

7月7日，清华大学人工智能研究院孵化企业瑞莱智慧RealAI在2023WAIC世界人工智能大会上，重磅发布了全新人工智能安全平台RealSafe3.0。近几个月来，以ChatGPT为代表的生成式人工智能狂飙突进，大模型时代已然降临。

清华人工智能 ChatGPT

北青网 2023-07-08

为人工智能发展系上“安全带”

中国工程院院士邬贺铨认为，以人工智能为代表的数字技术将重塑数字内容生产方式和消费模式，通用人工智能将实现知识与数据双轮驱动，把智脑加进去，未来单个模型有望通过迁移学习支持多种业务，并能精准选择节点，有效降低功…

经济日报 2023-08-16

给“狂飙”的AI系上“安全带”

一是智能驾驶，“Sora的认知能力使得自动驾驶可能在2024年获得突破”；周鸿祎说，“其实，工具面前人人平等，而人与人之间的差别在于才华、想象力和创造力。周鸿祎说，能“玩转”人工智能更是一种职场优势，“人工智…

自动驾驶 Sora 人工智能

搜狐资讯 2024-03-06

科技伦理审查制度初现：为狂飙的AI系上安全带

随着ChatGPT、Midjourney等AIGC产品走入公众视野，发展狂飙突进，人工智能（“AI”）所带来的伦理问题日益严重。

ChatGPT Midjourney AIGC 人工智能

汇业法律观察 2023-07-24

近期资讯

Android14 - SystemServer进程的启动与工作流程分析

SystemServer进程主要用于创建系统服务，我们比较熟知的AMS、PMS和WMS都是由它创建的。环境参数： android-14.0.0_r27 Ubuntu 22.04.5 LTS 在线源码

抛空 2024-12-26

RocketMQ结合源码告诉你消息量大为啥不需要手动压缩消息

背景最近同事发现线上发送的RocketMQ消息太大，同事为了节省网络带宽和存储空间，手动压缩消息然后再进行消息发送，发现磁盘也没有明显的缩减所以我打算结合源码告诉他RocketMQ自带的消息压缩

小奏技术 2024-12-26

2024-我赚到自媒体第一桶金

大家好，我是柒八九。一个专注于前端开发技术/Rust及AI应用知识分享的Coder 前言距离2024收尾，还有不到一周的时间了。今天，我们不聊技术，我们来谈点"感情"。我希望，我们是一种素未谋面见

前端小魔女 2024-12-26

reactHooks到底钩到了什么？

理解React Hooks的工作原理，需要理解它们"钩住"的是什么? Hooks的核心目标是将函数组件与React的状态和生命周期管理系统连接起来。钩子钩了什么？ Hooks “钩”住了以下几方面：

北海天空 2024-12-26

模型训练与数据分析

本次数据——直播带货。我这里的 "直播带货.csv"文件数据量有点大，大家可以使用Python进行模拟数据，建立cvs文件，用于数据分析来源本次数据分析目的——使用魔搭社区在线集成环境（IDE）进

ys指风不买醉 2024-12-26

Python入门项目：一个简单的办公自动化需求

前段时间，我npy说有一个很烦人的需求：有一个文章列表页面，总共10页，每页有30篇文章的标题、链接和日期。她领导希望把这些数据汇总进一个excel表格。她们公司有后台，由技术部的人负责维护，但技术部

hans774882968 2024-12-26

Mac电脑全屏【平铺】的时候，窗口周维有空隙

当我们需要将窗口铺满整个屏幕的时候，一般有两种方式：使用快捷键：按住 ⌘ 键，点击绿色按钮；平铺之后，就会发现窗口四周会有间隙，每次都需要手动拖动窗口，很麻烦；解决方法：打开设置；将【平铺

禁止摆烂_才浅 2024-12-26

react18与react17有哪些区别

react 18 相对于 React 17 的主要升级内容有哪些呢？并发特性、批量处理、ssr改进

飞翔的渴望 2024-12-26

【述职黑话】ToB交易业务解决方案之状态机

年底了大家都要述职，老板都会问：你这个方案，是否沉淀形成一套可复用解决方案？今天就介绍关于一个业务：状态变多、条件分支增多、状态转换规则、依赖关系变复杂，导致代码难以维护，代码可重用性和可扩展性变差

转转技术团队 2024-12-26

Docker-Dockerfile讲解(二)

接上一节讲过的FROM,MAINTAINER,RUN,EXPOSE,WORKDIR,USER,我们这一节继续讲解其他参数。

dessler 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1