2022年8月,Stable Diffusion发布之后引起不小轰动,用户输入简简单单的提示词即可生成对应的图片,此时,单纯使用原始版本的SD模型生成的图片其实算不上好看。
所幸,由于模型是开源的,任何人都可以进行微调,在Civit网站上,国内外网友热心研究并分享了很多效果炸裂的模型。细心的朋友发现,一开始模型的文件后缀是TensorFlow常用的ckpt,随后改成了Safetensors。
Safetensors是一种全新的格式,用于安全地存储张量,而且速度仍然很快,就如名字所暗示的,它是一种更安全的格式。官方介绍中提到,它可以防止别有用心的人使用恶意文件对用户进行DOS攻击。
这是我作为普通技术爱好者能看到的安全问题。随着生成式AI和大语言模型技术的发展,特别是考虑将这些技术在企业落地时,安全问题必须被视为重中之重。
值得特别关注的生成式AI安全问题
2023年,亚马逊云科技在北京举办re:Inforce 2023中国站活动上,就将生成式AI的安全问题视为重点。
亚马逊云科技大中华区解决方案架构部总监 代闻看到,目前,生成式AI已经应用到企业创新的各个环节,从智能客服提升客户体验,到自动生成代码提高技术生产力,到通过文生图加速内容创意,再到通过自动化文档处理提高组织运营效率,无处不在。
从代闻的介绍中了解到,原来都是技术部门利用人工智能工具帮助业务部门改良业务,而现在,随着生成式AI的到来,关于生成式AI的需求越来越多从业务部门提出,生成式AI俨然已被视为提升业务竞争力的重要手段。
生成式AI真正让AI在企业加速落地,正因为如此,才更需要考虑生成式AI落地的安全问题。除了刚才提到的Safetensors格式,生成式AI的安全问题其实非常多。
我们看到,OWASP公布了大型语言模型的十大安全风险,生成式AI的提供者会因为访问控制、权限控制、沙箱机制等问题造成数据泄露,这是技术层面上的。
此外,使用者使用不当也会造成自己数据泄露,韩国三星的数据泄露问题就是典型的错误示范。同时,它还提醒了企业在内部自己落地生成式AI的重要性。
与其在生成式AI高速发展后因为安全踩一脚刹车,不如在高速发展的同时就解决安全问题。
从代闻的介绍中了解到,亚马逊云科技正在从数据和模型的安全、应用的安全,以及全球合规三大方面下手解决问题。
首先,在数据和模型安全方面来看。
作为全球规模最大的公有云服务商,亚马逊云科技上存放着大量用户数据,在防止数据泄露和数据篡改方面经验丰富,可以说,数据安全是亚马逊云科技的立身之根本。
从代闻的介绍中了解到,无论是数据在存储状态,还是传输又或者是使用状态,亚马逊云科技提供的都是一套业内一流安全实践。
在模型安全方面,亚马逊云科技首先提到模型的访问策略很重要。代闻表示,生成式AI的访问策略将会非常地复杂,需要专门的服务来控制这些访问策略,需要IAM(Amazon IAM)来不断调整访问策略。
此外,模型的版本控制和模型的运营状态监控也很重要。这里需要提到的是亚马逊云科技的云上机器学习训练平台Amazon SageMaker,2017年刚发布的时候主要是用于训练,而后又陆续拓展了很多实用功能。
比如,Amazon SageMaker Model Cards是用来记录模型用途和元数据的,它能让机器学习专家以外的人也能看懂;Amazon SageMaker Model Registry是用来存放模型的大仓库;Amazon SageMaker Model Monitor是监控模型运行的工具。
2023年,亚马逊云科技发布了生成式AI托管服务Amazon Bedrock,用户不用管基础设施和安全的相关问题,直接调用API来使用生成式AI。同时,亚马逊云科技还精选了包括AI21 Labs、Anthropic、Stability AI等第三方模型,这是亚马逊认可的安全的模型。
Amazon Bedrock为那些希望用自己数据微调模型的企业提供方便,让企业安全地用自己的数据来做训练,能避免数据被共享或者泄露的问题。当然,作为一项大的服务,它也集成了秘钥管理系统Amazon KMS和权限管理系统Amazon IAM。
在应用的开发阶段要有安全手段。
作为大型云服务商,亚马逊云科技在DevSecOps也有一套成熟的实践。
2023年,新发布了一个叫Amazon CodeWhisperer的人工智能编码服务,开发者负责写注释,它负责生成代码。同时,它还能顺便帮助开发者扫描安全漏洞。
相比之下,Amazon CodeGuru Security是一种更强大的安全扫描工具,它可以扫描代码,也可以扫描调用包里的漏洞,能发现代码的逻辑漏洞,甚至还能便捷地集成到开发的工作流里,持续扫描并发现问题。
在应用上线后也要有安全手段。
应用开发上线后,生成式AI应用会像其他所有应用一样,享受到亚马逊云科技应用安全大礼包的悉心照顾,包括零信任、攻击保护等多个方面的能力。
作为零信任理念的一个实践,亚马逊云科技发布了Verified Access,它可以不需要VPN就能实现远程安全访问,它按照终端用户的环境和身份来实现访问授权,可以减少远程连接可能会带来的安全风险。
Amazon Verified Permissions是另外一种零信任理念的实践,它将零信任的能力延展到了用户自己的应用程序里,在应用代码里嵌入安全策略控制服务,在应用开发阶段就能落地零信任,上线后可进行更细粒度的安全控制。
网络防护上,亚马逊云科技的有应对DDoS攻击的Amazon Shield,有做网络应用防护的Amazon WAF,还有做防火墙策略管理的Amazon Firewall Manager。
最后,还有一个不得不提的重量级安全服务——Amazon GuardDuty,这是一种基于AI的识别威胁检测的服务,可以检测数据库、容器和无服务器等运行环境下的安全威胁。
最后,越来越重要的合规问题。
安全合规是全球都普遍重视的问题,随着云服务的发展,随着包括生成式AI应用在内的,越来越多的数据和业务上云,企业在安全合规上的挑战也越来越多,作为业务遍布全球的公有云服务商,亚马逊云科技获得了超过140个安全标准和合规认证,覆盖IaaS到PaaS的多个方面。
从代闻的介绍中了解到,亚马逊云科技也在利用人工智能技术来提升合规的效率,采用人工智能技术来大规模审查安全机制,从而大幅减少手动操作并降低人为错误。
小结
6月份在美国举办的re:Inforce重点围绕安全的主题来展开,然而,安全是一个重要的基础,是为上层的业务应用来服务的。作为当下最热的技术创新趋势,生成式AI备受瞩目,此次国内的re:Inforce则是提醒企业用户在落地生成式AI时要注意安全问题。