2023年的科技圈什么技术最火,毫无疑问,回答都会指向生成式AI。生成式AI的到来引发了业内外广泛讨论,也引发了大家对AI发展的新一轮思考——未来几年,生成式AI会成为最重要的生产力工具,无论是训练还是推理端,算力需求都将有望爆发式增长。
在6月28日举行的2023年亚马逊云科技中国峰会上,亚马逊云科技大中华区产品部总经理陈晓建发表了名为《专注创新,摆脱基础架构束缚》的主题演讲,他认为,“当前,虽然生成式AI只有短短几个月,但其超大规模人工智能模型和海量数据对高算力提出新要求,不断拉动算力需求快速增长。”
面对算力的需求井喷所带来挑战,亚马逊云科技通过自研芯片、各种丰富的计算、网络、存储组合,全面满足用户的多样化的算力需求。另外对于全球布局,亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力,为企业打造了坚实的底层架构基石。
(亚马逊云科技大中华区产品部总经理陈晓建)
事实上,无论是AI创新风潮带来的算力资源需求爆发,还是中国企业创新出海新格局下普遍的“全球化”需求,亚马逊云科技都能为企业提供助力。
AI创新推动算力需求井喷
毫无疑问,生成式AI是现在目前最为关注的创新技术,AI技术的爆发也直接推动了对算力资源需求的增长。针对算力需求井喷,亚马逊云科技通过自研芯片创新、弹性的计算存储组合以及Serverless架构,帮助客户简化运维,以更高性价比满足多样算力需求。
其一,提供全面深入的基础设施能力,包括Intel、AMD、英伟达,和自研的CPU及加速芯片产品。
美国计算机科学家、图灵奖获得者Alan Kay曾经说过:“真正认真对待软件的人应该制造自己的硬件。”亚马逊云科技十年创“芯”与这一论断不谋而合,通过长年深耕自研芯片和硬件,在底层技术层面建立起显著的差异化优势。
2013年,亚马逊云科技推出云服务器虚拟化引擎Amazon Nitro系统,由此开始了在云计算底层技术赛道上领跑行业的十年。2015年在收购Annapurna Labs之后,亚马逊云科技自研芯片驶入快车道,到2017年就已开发了多个自研芯片,包括虚拟化系统、云原生处理器和机器学习训练及推理芯片。
Nitro是亚马逊云科技的第一款自研芯片产品,也是亚马逊云科技自主创“芯”的起点。从2013年到2020年,亚马逊云科技已陆续将Nitro更新至第四代,而且Nitro的升级仍在持续,2022年推出的第五代Nitro更是将每瓦性能提高了40%。
亚马逊云科技自研芯片助推了Amazon EC2实例数量的快速增长,现在Amazon EC2实例已多达600余种,几乎覆盖了全部操作系统和应用,让数百万客户都能在亚马逊云科技上找到最合适的方案,应对极端的业务需求。
其二,针对高度弹性的计算资源,亚马逊云科技提供600多种不同的计算实例,从处理器、网络和存储等各种服务都能够与计算进行很好的结合,以积木的方式搭建出一个丰富灵活的计算实例的资源,满足多种不同算力的要求。
以存储为例,数据规模到达PB级别时存储方式变得非常重要,“热、温、冷、冻”不同类型的存储方式,成本和性能都有很大差别。Amazon S3对象存储提供8种存储层级,同时提供智能分层,自动选择最适合的存储层级。
大会上,陈晓建分享了Weta Digital维塔数码的案例。Weta Digital(维塔数码)是全球领先的综合性视觉效果公司,《阿凡达》、《指环王》的视觉效果便是出自这家公司之手,7次奥斯卡最佳特效奖、12次英国电影和电视艺术学院奖。
10多年前,在开发《阿凡达》第一部时,Weta Digital选择了自建,他们为此搭建了一个占地1万英尺的机房,构建了4000台物理服务器,共有 35000 个处理器核心。但十年之后,当他们在准备开发《阿凡达2》时,原有的集群已经力不从心。
亚马逊云科技为Weta Digital提供了各种从算力资源到云上制作的堆栈,机器学习的堆栈等等一系列的服务,提供非常强的伸缩性以及很好的性价比。用Weta Digital他们自己的话来说,他们在《阿凡达1》的时代花了整整14个月才看到了第一帧,《阿凡达2》8个月过去了,他们已经跑了33亿个线程小时。
其三,针对简化算力应用,亚马逊云科技推动云服务全面迈向Serverless。
亚马逊云科技在不断探索如何将云的弹性、敏捷性、按需付费的特性发挥到极致,在这个过程中逐步推动着云服务全面迈向Serverless。目前亚马逊云科技已经实现了全栈数据服务的Serverless化,开启了云服务全面Serverless的时代,让企业无需预置或管理基础设施,就可以运行几乎任何类型的应用程序或后端服务代码,可最大限度减轻运维工作,并增加业务敏捷性,更好地应对业务的各种不确定性。
陈晓建提到了《MARVEL SNAP》,这是一款基于漫威IP的数字卡牌游戏。这个游戏在2022年10月份推出以来广受用户好评,拥有全球超过数百万的客户,并且获得了年度手机游戏大奖。
该游戏工程副总裁Aaron Brunstetter 表示,“我们之前运营、维护过许多款游戏,但从技术角度来看,毫无疑问《MARVEL SNAP》是我们有史以来运营过的最顺利、最成功的游戏,这正是因为我们选择了亚马逊云科技”。
据悉,亚马逊云科技的Serverless 架构开发、构建和运行了该游戏,整个游戏没有使用任何一台EC2计算实例或容器,完全由事件驱动架构实现,这不仅帮助用户节省了成本,加快了应用开发速度,也减少了安全方面隐患。陈晓建称,“《MARVEL SNAP》在启动的时候没有一个后台错误,这在游戏行业是闻所未闻的。”
为全球化企业打造底层架构基石
如果说在过去十年企业出海专注于投资和发展,那么未来十年会有更多的企业专注于打造全球化的跨国公司,这就对IT架构提出更高要求。亚马逊云科技提供从中心到边缘的多种产品的解决方案,包括覆盖全球的基础架构,以及快速部署稳定系统的能力,还有全面支持全球各个国家和地区业务合规能力,成为用户创造坚实底层架构的基石。
无处不在的云服务
亚马逊云科技提供的高度安全可靠的云基础架构,让创新能够快速抵达每一个角落,为客户提供支持业务创新的算力,并能很好地支持客户的全球化布局战略。
OPPO有上百个云上的VPC和多个本地资源需要相互连接,每个国家又有不同的合法合规的要求,这就增加了全网的组网难度。在使用亚马逊云科技的CloudWAN广域网服务之后,OPPO 可通过本地网络提供商,连接到亚马逊云科技,通过中央控制面板和网络策略在分钟就可以建立起一个覆盖全球的自己的专用网。借助完整的网络视图,他们可以直观地了解整个网络的运行状况、安全和性能。
对亚马逊云科技来讲,Nasdaq(纳斯达克)是典型的资本市场用户,由于在网络的可靠性和延迟性上的特殊性,资本市场对于整个基础架构有着非常非常严苛的要求。Nasdaq选用了亚马逊云科技的Outposts,在他们位于新泽西州Carteret数据中心部署了业界第一个Private Amazon Local Zone,通过就近部署最大限度保证整个网络超低的延迟,为资本市场的扩张提供了有力的保障。
如今,亚马逊云科技全球31个区域的99个可用区,可以覆盖245个国家和地区。
快速部署可靠系统的能力
亚马逊云科技CTO Werner Vogels曾说过,“Everything fails,all the time”。所有的功能模块都有可能出故障,我们不能完全避免故障的发生,但是我们通过努力,把风险降到最低。
亚马逊云科技不仅提供了如区域隔离、控制面和数据面解耦、蜂窝架构、随机分片等设计思路,还通过各种运营模型和部署机制来保证云的弹性,例如服务责任模型、运营就绪审查、COE纠错流程等。
支持全球各个国家和地区业务合规能力
安全是实现合规的一种方式,亚马逊云科技也一直在高度致力于建设各种高度安全的云计算环境,有超过300种安全合规和治理服务,帮助企业能够更方便的搭建满足全球各地安全和合规要求的架构。
百富是全球领先的电子支付终端供应商,到今天为止,百富的电子支付终端出货量超过 6000 万台。在将旗下多个重要 SaaS 应用进行云上迁移时,百富意识到多个供应商提供的安全服务标准不统一,达不到他们对于整个支付安全的业务要求,而且很难进行集成和管理。
亚马逊云科技在安全合规方面提供了Amazon CloudHSM、Security Hub 等一系列服务,可以很好地帮助百富来保障用户支付的信息安全和业务安全。数据显示,通过使用亚马逊云科技的安全产品,百富的产品交付周期缩短了40%,降低了架构搭建及运维压力,从而带来20%的成本节约。
总结
在数字化时代,比起快速上线产品与服务、抢占市场先机,企业更需要主要关注的是“地基”的建设——计算能力够不够,弹性扩容难题怎么解,海外业务怎么快速部署......每一个都绕不开基础架构。
作为支持数字创新的关键生产力,云服务的重要性不言而喻,在当前生成式AI技术爆发的大环境下,亚马逊云科技通过广泛和深入的基础架构服务和功能,全方位助力客户进行全球业务拓展,实现AI浪潮下的求新求变。