日前,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了其性能卓越的开源模型Falcon 40B。作为拥有400亿参数的大语言模型(LLM),Falcon 40B是在Apache 2.0许可下提供,并在Hugging Face的开源大语言模型排行榜上位列榜首。
如今,客户可以将Falcon 40B部署在Amazon SageMaker JumpStart上,这是一个机器学习中心,提供预训练模型,可以使客户无需从头构建自己的模型即可获得Falcon 40B最先进的准确性和行业领先的性能,快速构建生成式AI应用程序。
在大模型应用和生成式AI开发已经成为AI开发主旋律的今天,亚马逊云科技推出的端到端机器学习服务Amazon SageMaker,可以进一步帮助AI开发者构建、训练和部署他们的大语言模型,这无疑将进一步加速生成式AI的普及和应用。
大语言模型崛起,AI开发如何高效开展?
从基于马尔可夫过程的n-gram到基于Transformer神经网络架构大规模语言模型,大语言模型作为机器学习(ML)模型的一个分支,已经成为整个人工智能领域最为活跃的研究议题之一。
随着预训练语言模型的兴起尤其是以ChatGPT和GPT-4为代表的开创性生成式智能应用的迅速普及,专注于语言领域的大语言模型,可以支持各类生成式AI应用,包括文本处理、总结摘要和会话问答,正在变革我们与机器的交互手段,推动新一轮的研究创新和产业演进。
但由于构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元,这将许多公司拒之门外。如何才能绕过构建、训练和部署大语言模型的高门槛,已经成为AI开发者面临的共同问题。针对这一问题,TII通过自身的创新实践已经给出了答案。
TII是一家全球领先的科研中心,一直致力于探索前沿的知识领域。在竭力提供探索性科学成果和变革性技术过程中,TII的科学家、研究员和工程师团队通过发布Falcon 40B开源模型,让更多的机构能够利用其卓越性能来推动AI赋能的解决方案的发展。
作为TII开发的世界一流的开源语言模型,Falcon 40B超过了Hugging Face开源大语言模型排行榜上的LLaMA-65B、StableLM、RedPajama和MPT等知名模型,展示了无需专门微调的卓越性能。
为了在整个开发过程中实现更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在内的众多客户使用亚马逊云科技端到端的机器学习服务Amazon SageMaker来构建、训练和部署他们的大语言模型。而TII同样也在使用Amazon SageMaker构建其Falcon 40B模型。
得益于SageMaker是一项完全托管的服务,TII可以专注于开发自定义的训练机制和优化功能,而无需管理其机器学习基础设施。为了最大限度地降低训练成本并缩短上市时间,TII采取了多项优化措施,包括编写自定义矩阵乘法以加快训练速度。在整个训练过程中,亚马逊云科技还与TII密切合作以利用SageMaker增强可用性,确保训练顺利进行,减少对开发人员的干扰。
自2023年5月TII于在Apache 2.0许可下发布了其Falcon 40B模型以来,Falcon 40B在各种基准测试中的表现都优于当下的同类模型,展示了无需专门微调的卓越性能。同时,为了让客户更轻松地访问该模型,亚马逊云科技让Falcon 40B可以通过Amazon SageMaker Jumpstart部署。现在,各个行业、各种规模的客户都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足他们的特定需求,如翻译、问答、信息总结、图像识别等应用程序。
助力大模型训练,亚马逊云科技有何过人之处?
在帮助TII构建其Falcon 40B模型过程中,Amazon SageMaker功不可没,也正是得益于其在大模型训练中的超强能力,亚马逊云科技在不久前全球市场分析机构Gartner发布的《2023 云 AI 开发者服务魔力象限》报告中,被评为“领导者”,且在执行能力轴上排名最高。
事实上,为了助力AI开发,亚马逊云科技不只有Amazon SageMaker这样的利器,在今年4月,亚马逊云科技还重磅推出Amazon Bedrock托管服务和Amazon Titan模型,它可以让开发者借助基础模型构建和扩展生成式AI应用程序。
具体来说,Amazon Bedrock让开发者可以通过API访问AI21Labs、Anthropic和Stability AI等热门AI公司的预训练基础模型,还提供对亚马逊云科技开发的基础模型系列Amazon Titan的独家访问。Amazon Bedrock提供无服务器体验。客户可以轻松找到适合自身业务的模型,快速上手,在确保数据安全和隐私保护的前提下,使用自有数据基于基础模型进行定制,并使用已经熟悉的亚马逊云科技工具和能力,将定制化模型集成并部署到应用程序,无需自己管理基础设施。
今年6月,德勤宣布将利用亚马逊云科技的Amazon Bedrock全托管服务扩展其生成式人工智能(AI)能力,通过将亚马逊云科技的技术力量与德勤深厚的AI经验和顶尖人才相结合,帮助客户更快速地大规模构建新的AI应用,释放生成式AI能力的巨大价值。
不仅如此,亚马逊云科技还面向个人开发者推出了免费的AI编程助手Amazon CodeWhisperer,Amazon CodeWhisperer从数十亿行公开代码中学习之外,还基于亚马逊的代码进行了训练,可以为Amazon EC2、Amazon Lambda和Amazon S3等云服务生成最准确、最快和最安全的代码。开发者使用Amazon CodeWhisperer,完成任务的速度平均快57%,成功率高27%。
如今,埃森哲已经开始用 Amazon CodeWhisperer 加快编码任务,作为其Velocity 平台软件工程最佳实践计划的一部分。CodeWhisperer可以帮助不太熟悉亚马逊云科技的开发人员更快地熟悉使用亚马逊云科技服务开发的项目。借助CodeWhisperer,埃森哲新的开发人员就能够为Amazon S3和 Amazon DynamoDB 等亚马逊云科技服务编码。在短时间内,他们就能够高效工作并为项目做出贡献。
除此之外,全球数字工程领导者Persistent Systems也已经成为利用亚马逊云科技最新生成式AI服务的合作伙伴,并为其16000多名工程师配备Amazon CodeWhisperer编程助手,以便他们更快速、更安全地为企业客户构建和交付行业应用程序。
如今,大模型和生成式AI浪潮正在以前所未有的速度席卷全球,亚马逊云科技凭借在大模型和生成式AI方面的持续创新,正在大大降低AI开发的门槛,成为AI产业创新发展的坚实底座。未来,亚马逊云科技必将吸引更多的AI开发者使用公司的创新产品和平台,并赋能他们加速AI创新。