2023年7月6日,以“智联世界·生成未来”为主题的2023世界人工智能大会(WAIC)在上海召开。在2023 WAIC上,预训练大模型和生成式AI成为了绝对的主角。作为全球第一大公有云厂商,亚马逊云科技自然也不会错过本次盛会。
在2023年6月初,亚马逊云科技就宣布,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了开源模型Falcon 40B。拥有400 亿参数的大语言模型(LLM)的Falcon 40B,在Hugging Face的开源大语言模型排行榜上位列榜首。
TII于2023年5月在Apache 2.0许可下发布了其Falcon 40B模型。自发布以来,Falcon 40B 在各种基准测试中的表现都优于当下的同类模型,展示了无需专门微调的卓越性能。为了让客户更轻松地访问该模型,亚马逊云科技让Falcon 40B可以通过Amazon SageMaker Jumpstart部署。
亚马逊云科技还在2023年6月底宣布成立亚马逊云科技生成式AI创新中心,旨在帮助客户成功构建和部署生成式AI解决方案。亚马逊云科技为该中心投资一亿美元,亚马逊云科技生成式AI创新中心团队由战略专家、数据科学家、工程师和解决方案架构师组成,将与客户密切合作,逐步构建生成式AI的定制解决方案。
亚马逊云科技生成式AI产品研究院院长Sherry Marcus博士参与了“WAIC 2023产业发展全体会议”与“2023上海AI会客厅之‘源创未来’开源创新生态发展论坛”并发表主题演讲。Sherry Marcus认为有三个原因让机器学习现在正处在转折点:网络数据爆炸性增长,而且这些数据有可获得性;算力增加;Transformer AI模型出现以及该模型的复杂度演变。
Sherry Marcus表示,绝大多数客户并不需要从零开始来训练模型,不能依赖一个万能的、单一的大型语言模型来应对各种任务,正确的做法应该是让客户可以访问多个模型,然后根据自己的需求和数据定制自己的模型。亚马逊云科技认为,应该在大模型的基础之上,确保以私密和安全的方式让用户能够定制自己的模型。
亚马逊云科技可以为客户提供已经训练过的以及预训练模型,其中包括Amazon Titan系列基础模型,或是来自于Stability AI、Anthropic等第三方合作伙伴训练过的模型,以及通过Amazon SageMaker JumpStart提供的开源模型。
Sherry Marcus表示,客户可以根据自身需求,在大语言模型的基础之上,使用自己的数据进构建专业化或者专门化的模型,从而一方面让客户可以有大模型的丰富度,同时也可以获得小模型的快速迭代。
针对当前出现的多个LLM排行榜,Sherry Marcus认为,这些排行榜的评估通常是基于特定的案例和任务,但并不代表模型的全部价值。亚马逊云科技的观点是,在将这些模型应用于客户的数据之后,才能真正评判其效果。
Sherry Marcus相信未来的大模型将更加庞大,也将涌现有更多不同的模型,包括多模态模型,以及出现更多量身定制的模型,此外对于如何在特定商业中的更好地使用这些模型也将有更深入的理解。
亚马逊云科技在生成式AI领域快速创新,短短3个月先后发布了包括Amazon Bedrock在内的多款生成式AI工具和平台。Sherry Marcus表示,生成式AI面临的挑战是如何理解它给各行业转型带来的影响以及能够带来哪些应用。同时,她呼吁业界把眼光放得更长远些,关注生成式AI将在未来引发的颠覆式创新。那么,开创了公有云的亚马逊云科技,将再次在生成式AI浪潮中,生成新的未来么?