当前位置:首页|资讯|英伟达|OpenAI

英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

作者:AI新智界发布时间:2023-11-16

英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍,支持 OpenAI 的 Chat API

据 IT 之家 11 月 16 日报道,英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1