文:科技商业 于洪涛
以AIGC为代表的大语言模型,被认为是下一代的互联网入口。
正因如此,各大互联网巨头都在抢滩AIGC。据统计,仅在中国市场上,已经和计划要推出AIGC大模型的公司就多达30家,竞争可谓激烈。
然而,同样是互联网巨头的亚马逊云科技,其决定却出人意料:虽然也推出自己的大语言模型Amazon Titan,但却不直接面向最终用户,而是致力于大模型的普惠化,去帮助企业训练和应用好自己的大模型。
显然,与大家纷纷亲自下场淘金AIGC不同,亚马逊云科技坚持只赚卖水钱。那么,其到底是怎么想的,又准备怎么做呢?
前不久,亚马逊云科技数据库、数据分析和机器学习全球副总裁Swami Sivasubramanian用一篇博客文章,阐释了其在AIGC方面的理念。他将为AIGC提供能力的机器学习模型称为基础模型(Foundation Models)。
实际上,在ChatGPT出现之前,人们对于大模型的定义就是基础模型,基于大量数据进行预训练而产生的。所谓“基础模型”,就是不能直接应用在具体场景中,而要通过少量样本数据对模型进行微调之后再落地应用。
ChatGPT的出现,似乎改变了人类对于大模型/基础模型的认知,令AIGC成为最终用户可以直接使用的面向通用场景的应用。当然,这些AIGC也都预留了API,供开发者进行调用,从而在具体的行业应用场景中落地。
亚马逊云科技则完全坚持“基础模型”的定位。其新推出的Amazon Titan基础模型,并不能直接使用,而是要通过Amazon Bedrock服务来调用,执行专属于其业务领域的特定功能,或者打造定制化的专属基础模型。
亚马逊云科技大中华区产品部总经理陈晓建表示,亚马逊云科技的使命是推动AIGC技术的普惠化,降低技术和资金门槛,让各种技能水平的开发人员和各种规模的组织,都有机会使用AIGC进行创新。
正是基于这样的理念,亚马逊云科技发布了自己的AIGC产品体系。
除了前面提到的刚刚发布的自然语言基础模型Amazon Titan和基础模型应用构建工具Amazon Bedrock之外,亚马逊云科技此前已经推出了用于模型训练和推理的芯片和计算实例,以及AI编程助手Amazon CodeWhisperer。
Amazon Bedrock基于基础模型构建和扩展AIGC应用。目前,Amazon Bedrock支持五款已经发布的基础模型,其中包括AI21 Labs开发的多语种大语言模型Jurassic-2系列、Anthropic开发的对话和文本处理大语言模型Claude、Stability AI开发的文生图基础模型Stable Diffusion,外加亚马逊云科技自己的两款Amazon Titan基础模型。
Amazon Titan是亚马逊云科技自己开发的基础模型系列,目前包括Titan Text和Titan Embeddings两个模型。其中Amazon Titan Text专注于自然语言处理任务,比如归纳总结和文本生成;而Amazon Titan Embeddings则用于搜索和个性化等企业任务,增强搜索的准确性并改善个性化推荐。
Amazon EC2 Trn1n和Inf2实例,是更具成本效益的AIGC云基础设施。Amazon EC2 Trn1n由其专门开发的训练芯片Trainium支持,专为大型网络密集型模型设计,可以提供1600 Gbps的网络带宽。Amazon EC2 Inf2则由其第二代推理芯片Inferentia2支持,相比同类EC2实例,推理性价比提高了40%。
Amazon CodeWhisperer则是内置了AIGC能力的编程工具。它不直接生成代码,但可以为开发者实时生成代码建议,并通过扫描代码来发现隐蔽漏洞,乃至标记或过滤疑似开源代码。
基于上述四款服务,亚马逊云科技虽然不直接面向客户提供AIGC服务,但可以为企业提供完整的AIGC能力。
按照推动AIGC普惠化的理念,基于上述四款AIGC服务,亚马逊云科技可以为用户提供三种AIGC构建和应用方式:一是利用专门的机器学习基础设施来构建自己的基础模型;二是利用预训练的基础模型来构建应用程序;三是使用内置的AIGC服务而无需具备专门的基础模型知识。
在这里,还必须要提到Amazon SageMaker。这是一个机器学习模型的构建、训练和部署平台,可以让用户从零开始构建各类模型,其中当然也包括AIGC基础模型。相比而言,Amazon Bedrock则是专门基于那五个基础模型,来开发AI应用或者训练企业自己的定制化基础模型(专属大模型)。
数据安全方面的保障,也是亚马逊云科技在AIGC方面能够为客户提供的价值之一。这也是很多企业在使用大语言模型时的主要顾虑,因为需要把自己的数据上传到这些大模型运营方的服务器上,存在很大的数据泄露等安全隐患。
而亚马逊云科技提供的Stable Diffusion、Claude、Jurassic-2等大模型调用服务,都是部署在自己的云上,拥有成熟可靠的数据安全保障。同样,客户也可以放心地提供自己的数据,来进一步训练定制化基础模型。
值得注意的是,AIGC目前还处于发展的初期阶段,其长期影响需要持续跟踪观察。无论如何,用户需要的都不仅仅是基础模型本身,更要能够与自身业务紧密结合,通过简单使用基础模型来实现业务价值。
这是所有AIGC参与者的未来努力方向。