面对海量数据,人类如何始终保持探索能力,有效驾驭数据?这便是云计算带来的价值!
正如亚马逊云科技CEO Adam Selipsky所言,虽然数字世界像满天星空,充满不确定性,有时候浩瀚无垠,有时候深不可测,甚至需要面对极端挑战,但也充满着无限可能。只要我们正确使用工具,就可以战胜环境,打开探索宇宙奥秘的大门。
所以,云计算就像火箭、卫星和空间站,给了人类探索数字世界的有效工具,创造出互联互通的新世界!
那么,具体而言,云计算正在如何影响整个世界?如何帮助企业始终保持探索能力?亚马逊云科技re:Invent全球大会有很多关键信息点!
▲亚马逊云科技大中华区产品部总经理 陈晓建
“亚马逊云科技在每年的re:Invent全球大会上,都会发布许多重磅的新服务、功能和应用,来支持遍及全球各地、来自千行百业的客户进行不断的创新和重塑。面临全球经济的不确定性,各种规模的客户都希望能进一步削减成本、增强业务的灵活性并加速创新。我们希望能通过技术的不断创新,让全球包括中国的客户能凌云驭势、重塑未来。”亚马逊云科技大中华区产品部总经理 陈晓建,在2022 re:Invent 中国行活动上,具体介绍了是云计算的诸多创新点。
从底层基础技术创新,到端到端的数据线路,再到云原生步伐的坚定,亚马逊云科技把云计算带到一个新高度,尤其是最新发布的数据战略,值得重点关注。
亚马逊云科技一直在数据存储和分析、机器学习等方面创新,并应用到实践中。如:通过数据分析为用户进行书籍推荐;在云计算领域推出云原生数仓Amazon Redshift和首个云原生的数据库服务Amazon DynamoDB。
亚马逊云科技通过提供端到端的全面数据解决方案,帮助客户打造从数据的摄入、数据存储与查询,到数据分析、商业智能,再到人工智能与机器学习创新,并通过安全合规的方式进行集团内或公司之间的共享和输出。
具体而言,构建端到端的数据战略,包括三个核心:
1)建立面向未来的云原生数据基础设施;
新一代云原生数据基础设施,需要用合适的数据库工具应对所有类型的工作负载。
亚马逊云科技拥有最完整的数据库,包括关系数据库(如 Amazon Aurora)和 8 个专用数据库(如Amazon DynamoDB)为应用程序提供数据工作负载支持。同时,亚马逊云科技可以为分析工作负载提供最全面的服务,例如使用 Amazon Redshift 的 SQL 分析、使用 Amazon EMR 的大数据分析、使用 Amazon QuickSight 的商业智能以及使用 Amazon OpenSearch 的交互式日志分析。
亚马逊云科技还提供一系列广泛的功能来支持机器学习工作负载,包括 PyTorch 和 TensorFlow 等深度学习框架、可以更轻松地创建 ML 模型的 Amazon SageMaker 等服务,以及具有内置机器学习功能的 AI 服务,例如Amazon Transcribe 和Amazon Polly。
如今,数以万计的亚马逊云科技客户使用Amazon Athena进行数据查询,许多客户也在使用Apache Spark来进行复杂的数据处理,不想花时间在复杂的基础架构层面的配置和运维上。
除了强大的数据库能力,云原生数据基础设施能力,还要支撑在大规模运行的情况下依然保持高性能,并且通过智能化手段和工具为客户降低运营复杂性,有效提升工作效率。更重要的是,提供高级别的可靠性和安全性,来保护企业的数据存储。
2)实现高效、跨组织的数据一体化融合;
连接数据的能力与云原生数据基础设施一样重要,企业需要一套解决方案来实现高效、跨组织的数据一体化融合,中间涉及从自动化数据路径到数据治理工具。
而ETL,是挖掘数据价值,进行机器学习建模的必要前置步骤。在现实情况中,绝大多数数据都是多源异构的,ETL将把分散、零 乱、标准不统一的数据整合到一起,通过抽取、清洗转换之后加载到分析服务。
Amazon Glue是一项完全托管的ETL 服务,深受市场的欢迎。作为Serverless数据分析产品,Amazon Glue让客户不需要做底层资源的准备和配置,而只要关注在ETL和数据本身。
在今年亚马逊云科技提出“零ETL”功能后,企业无需再次手动构建数据管道。亚马逊云科技多项全新的集成功能,可帮助客户实现“Zero-ETL”(零ETL)。什么是零ETL呢?是指Amazon Redshift流式注入功能正式可用后,日志数据无需从MSK进入Amazon S3,再通过代码拷贝进入Amazon Redshift做分析。Amazon MSK和Amazon Redshift可以直接打通,同时把数据同步从分钟级别提高到了秒级,极大地提升了实时性。
Amazon Redshift现在支持将文件从S3自动化的复制到Amazon Redshift,避免了人工操作。在Amazon Redshift的分析负载中,有相当一部分的数据来自于关系型数据库Amazon Aurora。通过把Amazon Aurora和Amazon Redshift 打通,大大降低了用户使用这些服务的工作量,提升了数据使用效率。
3)借助教育和工具,使数据普惠化。
Amazon DeepRacer 通过强化学习对学生进行ML培训,来自 150 个国家/地区的超过 310,000 名开发人员已经通过 亚马逊云科技 DeepRacer 接受了机器学习方面的培训。希望通过成熟的培训和认证体系,以及AIML奖学金项目,让更多的学生、业务人员或者IT从业者能够充分掌握云计算技术,从而更好地拥抱这样一个信息爆炸时代。
最新推出的Amazon QuickSight Q,不仅仅预备了预测的能力,而且还能揭示数据背后的原因,而且这些都是系统自动完成的。
除此之外,通过低代码机器学习,可以快速进入业务需要的机器学习场景中。通过Amazon SageMaker Data Wrangler、Amazon SageMaker Canvas、Amazon SageMaker AutoPilot、Amazon SageMaker JumpStart,可以帮助使用者从数据准备到模型构建和开发,到训练和调整,直到部署和运营管理,在全生命周期的每个阶段轻松上手。
亚马逊云科技认为,云原生的数据战略由三个关键因素构成,极致的性能,轻松和无处不在的连接,以及推行数据的普惠化。
有数据显示,未来五年产生的数据量将会是数字时代开始以来的两倍多。可见,数据爆炸不是未来,而是现实,如何管理海量数据,挖掘数据价值,对每个组织来说都是巨大的挑战。而今天亚马逊云科技在云上各个层面的创新,极大地降低了数据的使用门槛,让数字世界的未来充满更多可能性!