“我们正处在一个令人激动的机器学习被大规模采用的转折点上,我们也相信生成式AI将会重塑大量客户体验和应用程序。”亚马逊云科技生成式AI产品研究院院长Sherry Marcus说,基础模型拥有巨大的潜力,但我们仍处在初级阶段。
亚马逊云科技生成式AI产品研究院院长Sherry Marcus
今年4月,亚马逊云科技发布了一系列生成式AI的产品和服务,在底层推出了Amazon EC2 Trn1n和Amazon EC2 Inf2实例,在中间层发布了生成式人工智能服务Amazon Bedrock预览版,在顶层宣布2022 年推出的自动代码生成工具Amazon CodeWhisperer正式可用。
最近Amazon Bedrock也入选了2023年世界人工智能大会九大“镇馆之宝”。Amazon Bedrock是一项托管服务,允许用户通过API访问AI21 Labs开发的Jurassic-2多语种大语言模型系列、Anthropic开发的大语言模型Claude、Stability AI开发的文生图基础模型Stable Diffusion,以及亚马逊云科技自有的Amazon Titan模型。
“训练大预言模型或者大型多模态模型,是非常消耗资金和时间的。”Sherry Marcus认为,绝大多数企业不需要自己从零开始来训练模型,亚马逊云科技认为不能依赖一个万能、单一的大模型来应对各种任务,应该根据自己的需求和数据定制自己的模型,同时在大模型的基础之上,确保以私密和安全的方式进行,这种方式也能加速后续迭代。
Amazon Bedrock的优势在于,企业可以通过API使用基础模型加速生成AI应用程序开发,也可以使用亚马逊云科技的基础设施来进行生成式AI应用。
“只需要点击几次就可以完成Amazon Bedrock的部署,首先需要选择一个满足自己使用需求的基础模型,之后对其进行微调,Amazon Bedrock将自动部署基础模型进行推理,使用Amazon Bedrock EPI将提示词发送到模型,最后接受响应。”Sherry Marcus说。
目前Amazon Bedrock已经有了一些用例,德勤正在利用Amazon Bedrock全托管服务扩展其生成式人工智能(AI)能力,借助Amazon Bedrock,德勤可以为客户提供更具成本效益的无服务器API,以便亚马逊云科技客户构建生成式AI应用。
亚马逊云科技内部的服务团队也在使用Amazon Bedrock赋能他们的服务,日前宣布Amazon AppFabric用于提高SaaS应用程序的生产力和安全性,这就相当于使用了Amazon Bedrock的能力,跨应用程序地自动提出建议、执行任务或生成洞察,并在用户首选的应用程序中返回结果。
Amazon Bedrock中的Amazon Titan模型包含两个大语言模型Amazon Titan Text和Amazon Titan Embeddings。Titan Text大语言模型可以总结文本生成、分类、开放式回答和信息提取等任务,Titan Embeddings是文本嵌入式大语言模型,能够把文本的输入翻译成包含语义的数字表达。
在开发基础模型时,亚马逊云科技在全面开发流程的每个阶段都会坚持负责任的AI的原则。在整个设计、开发、部署和运营中考虑了一系列因素,包括准确性,例如摘要与基础文档的匹配度,传记是否符合事实;公平性,例如输出结果是否平等对待不同人口群体;知识产权和版权注意事项;使用适当,例如过滤掉用户在法律建议、医疗诊断或非法活动的请求;有害性,例如仇恨言论、亵渎和侮辱;隐私,例如保护个人信息和客户提示语。
Sherry Marcus说,亚马逊云科技将这些问题的解决方案融入到获取训练数据的流程、基础模型本身以及用以预处理用户提示语和后处理输出结果的技术中,对我们所有的基础模型,积极投资各种方法改进其功能,并在客户尝试新的用例时向他们学习。亚马逊云科技也在与学术界、业界和政府合作伙伴一起,致力于以负责任的方式持续开发生成式AI。
顶层的编程助手Amazon CodeWhisperer免费向个人开发者提供,并支持10种以上的编程语言。Amazon CodeWhisperer可以使开发者的开发速度平均提升57%。
亚马逊云科技大中华区机器学习产品总监张洋提到,Amazon CodeWhisperer在代码编辑器中直接推荐一个或多个代码片段,帮助开发人员在编码过程中提高生产力。Amazon CodeWhisperer提供的代码建议是基于数十亿行在亚马逊和开源代码进行训练的大语言模型(LLM),开发人员可以通过简单点击Tab键,快速轻松接受最顶端的推荐, 使用方向键查看更多推荐,或者继续编写代码。
亚马逊云科技大中华区机器学习产品总监张洋
Amazon CodeWhisperer可以对其训练数据进行安全漏洞分析,并尽可能过滤掉许多安全漏洞。这个过滤的目的是从训练数据中排除不安全的代码模式,避免模型在未来学习和生成类似的代码。为了帮助开发人员负责任地构建应用程序,Amazon CodeWhisperer还提供了一个参考追踪器,显示推荐代码的许可证信息,并在必要时提供对应开源仓库的链接。其可以通过自动检测的方式,去找到这些安全相关的漏洞,或者是从开源的License提供给最终的用户。
现在埃森哲Velocity团队正在使用Amazon CodeWhisperer加快编码任务,借助 Amazon CodeWhisperer,埃森哲新的开发人员就能够为Amazon S3和Amazon DynamoDB等亚马逊云科技服务编码。实现减少30%的开发工作量,客户的开发人员可以更专注于安全、质量和性能的提升。
生成式AI在未来的发展中还会遇到非常多的挑战。Sherry Marcus认为,最大的挑战就是我们去理解它能够给各个行业的转型带来的影响,能够带来哪些应用,看到未来会造成什么样的一些颠覆式创新。同时其必须是负责任的AI,我们在使用AI的时候,要能够确保它是在安全、合法和负责任的环境当中运行。
亚马逊云科技也在通过一流基础模型构建、基础模型定制、低成本低延时、专业代码生成工具提高工作效率四个关键因素,加速客户的生成式AI之旅。