7月24日,《每日经济新闻》记者从英伟达处获悉,英伟达推出了全新NVIDIA AI Foundry服务和NVIDIA NIMTM推理微服务,与同样刚推出的Llama 3.1系列开源模型一起,为全球企业提供生成式AI相关服务。
根据英伟达方面的数据,Llama 3.1多语种大语言模型(LLM)集合是一个具有8B、70B和405B三种参数规模的生成式AI模型集合。当与适用于Llama 3.1 405B的NVIDIA NIM推理微服务结合使用时,NeMo Retriever NIM微服务可以为RAG工作流中的开放和商业文本问答带来极高的检索准确性。NVIDIA AI Foundry能提供一种可用于快速构建自定义超级模型的端到端服务。
根据英伟达的说法,借助NVIDIA AI Foundry,企业能使用Llama 3.1模型和NVIDIA NeMo平台(包含在Hugging Face RewardBench上排名第一的NVIDIA Nemotron-4 340B Reward模型)创建自定义模型;还可以使用自有数据以及由Llama 3.1 405B和NVIDIA Nemotron Reward模型生成的合成数据,来训练这些超级模型。
创建自定义模型后,企业可构建NVIDIA NIM推理微服务,以便在其首选的云平台和全球服务器制造商提供的NVIDIA认证系统上,使用自己选择的最佳机器学习运维(MLOps)和人工智能运维(AIOps)平台在生产中运行这些模型。
英伟达创始人兼首席执行官黄仁勋提出,Llama 3.1开源模型标志着全球企业采用生成式AI的关键时刻已经到来,Llama 3.1将掀起各个企业与行业创建先进生成式AI应用的浪潮。
Meta创始人兼首席执行官马克·扎克伯格则表示,全新的Llama 3.1模型是开源AI迈出的极其重要的一步,英伟达还和Meta一起为Llama 3.1提供了一种提炼方法,供开发者为生成式AI应用创建更小的自定义模型。
每日经济新闻