英伟达更新TensorRT-LLM版本，支持OpenAI Chat API

作者：中关村在线发布时间：2023-11-16

2023-11-16 11:42:57 作者：姚立伟

11月16日，微软Ignite 2023大会盛大召开，英伟达高管出席并宣布更新了TensorRT-LLM版本。该版本现已支持对OpenAI Chat API的支持，并且还增强了DirectML功能。

今年10月份，英伟达面向数据中心和Windows PC推出了Tensor RT-LLM开源库。其中最大的亮点在于，如果Windows PC配备英伟达GeForce RTX GPU，那么使用TensorRT-LLM将使LLM在Windows PC上的运行速度提高四倍。

在Ignite 2023大会上，英伟达宣布更新TensorRT-LLM版本，并且新增了OpenAI的Chat API支持，同时还改进了DirectML功能以及Llama 2和Stable Diffusion等AI模型的性能。

利用这款工具包（即TensorRT-LLM），开发者可以在PC或工作站上快速创建、测试和定制预训练的生成式AI模型和LLM。目前，有关该产品抢先体验注册页面已经开放。

据悉，在本月晚些时候，英伟达将会发布TensorRT-LLM版本更新，其推理性能提高了5倍，并且还支持 Mistral 7B 和 Nemotron-3 8B等其它主流LLM技术。

用户可以在拥有8GB以上显存的GeForce RTX 30系列和40系列GPU上运行TensorRT-LLM，并且一些便携式Windows设备也能够享受到快速、准确的本地LLM功能带来的便利。

近期资讯

PS4使用技巧与心得分享：提升游戏体验的必备指南

PS4，作为一款受欢迎的游戏主机，吸引了无数玩家的喜爱。你只需要按下主机上的电源按钮，或者用手柄上的“PS”按钮就能启动它。

新报观察 2024-12-31

软控股份取得摆臂机构、卷取装置和帘布裁断机专利，解决现有技术中安全性及稳定性较差的问题

金融界2024年12月31日消息，国家知识产权局信息显示，软控股份有限公司取得一项名为“摆臂机构、卷取装置和帘布裁断机”的专利，授权公告号CN222225472U，申请日期为2024年2月。

金融界 2024-12-31

上海金腾辉取得双面胶带卷绕分离装置专利，能够快捷固定不同规格双面胶带并分离

金融界2024年12月31日消息，国家知识产权局信息显示，上海金腾辉科技有限公司取得一项名为“一种双面胶带卷绕分离装置”的专利，授权公告号CN222225469U，申请日期为2024年5月。

金融界 2024-12-31

软控股份取得巨胎帘布卷取装置和帘布裁断机专利，解决现有技术中的帘布裁断机的帘布卷取人工引料费时费力的问题

金融界2024年12月31日消息，国家知识产权局信息显示，软控股份有限公司取得一项名为“巨胎帘布卷取装置和帘布裁断机”的专利，授权公告号CN222225471U，申请日期为2024年2月。专利摘要显示，本实用新型提供了一种巨胎帘布卷取装置和帘布裁断机。

金融界 2024-12-31

亦五笔输入法：提升中文打字效率的实用技巧与方法

在当今这个信息化的时代，打字已经成为我们日常生活中不可或缺的一部分。五笔输入法作为一种高效的中文输入方式，受到了很多人的喜爱。而“亦五笔”作为五笔输入法的一种变体，最近也逐渐引起了大家的关注。那么，亦五笔到底怎么打呢？今天就跟大家聊聊这个话题，看看如何通过亦五笔来提高我们的输入效率。首先，了解一下什么是亦五笔。

新报观察 2024-12-31

Windows 7截图技巧与快捷键详解，轻松捕捉屏幕信息

在使用Windows7的过程中，截图是一个非常实用的功能。无论是为了记录重要信息，还是分享有趣的内容，截图都能帮助我们快速捕捉屏幕上的画面。今天，我们就来聊聊Windows7中截图的快捷键和一些实用的小技巧。首先，Windows7提供了几种不同的截图方式。最常用的方式就是使用“PrintScreen”键。

新报观察 2024-12-31

东莞市楚为不锈钢取得方便不锈钢带进行收卷的缠绕装置专利，进一步提升散热效果延长使用寿命

金融界2024年12月31日消息，国家知识产权局信息显示，东莞市楚为不锈钢材料有限公司取得一项名为“种方便不锈钢带进行收卷的缠绕装置”的专利，授权公告号CN222225470U，申请日期为2023年12月。专利摘要显示，本实用新型公开了一种方便不锈钢带进行收卷的缠绕装置，涉及不锈钢带收卷技术领域。

金融界 2024-12-31

浙江铭普环境科技取得一种软管光催化清洁薄膜生产的收卷结构专利，在相同工作时间内增加产能

金融界2024年12月31日消息，国家知识产权局信息显示，浙江铭普环境科技有限公司取得一项名为“一种软管光催化清洁薄膜生产的收卷结构”的专利，授权公告号CN222225476U，申请日期为2024年4月。

金融界 2024-12-31

滁州瑞林包装取得包装复合膜生产用卷膜装置专利，解决包装膜收卷的褶皱等问题

金融界2024年12月31日消息，国家知识产权局信息显示，滁州瑞林包装材料有限公司取得一项名为“一种包装复合膜生产用卷膜装置”的专利，授权公告号CN222225467U，申请日期为2024年5月。

金融界 2024-12-31

在信息爆炸时代，如何有效辨别真假信息成为每个人的必修课

在这个信息爆炸的时代，真假信息交织在一起，辨别真伪变得越来越重要。无论是新闻、商品还是社交媒体上的各种内容，我们都需要有一双慧眼，去分辨那些真假难辨的东西。这样，我们才能避免被误导，保护自己的权益。要说怎么查真假，首先得学会观察。很多时候，信息的表象可能很吸引人，但深入一看，往往会发现一些不寻常的地方。

新报观察 2024-12-31

英伟达更新TensorRT-LLM版本，支持OpenAI Chat API

推荐体验

相关资讯

英伟达预告新版 TensorRT-LLM：推理能力飙升 5 倍，支持 OpenAI 的 Chat API

1116 早早聊 AI 资讯｜ChatGPT Plus 账号暂停注册！全网溢价、英伟达预告新版 TensorRT-LLM、小米 Vela 开源系统正式发布...

Function Call & ReACT，Xinference 兼容OpenAI API，支持LLM原生function call

Elasticsearch 开放 inference API 增加了对 OpenAI chat completions 的支持

Uber 创建镜像 OpenAI API 的 GenAI 网关，支持 60 多个 LLM 用例

近期资讯

PS4使用技巧与心得分享：提升游戏体验的必备指南

软控股份取得摆臂机构、卷取装置和帘布裁断机专利，解决现有技术中安全性及稳定性较差的问题

上海金腾辉取得双面胶带卷绕分离装置专利，能够快捷固定不同规格双面胶带并分离

软控股份取得巨胎帘布卷取装置和帘布裁断机专利，解决现有技术中的帘布裁断机的帘布卷取人工引料费时费力的问题

亦五笔输入法：提升中文打字效率的实用技巧与方法

Windows 7截图技巧与快捷键详解，轻松捕捉屏幕信息

东莞市楚为不锈钢取得方便不锈钢带进行收卷的缠绕装置专利，进一步提升散热效果延长使用寿命

浙江铭普环境科技取得一种软管光催化清洁薄膜生产的收卷结构专利，在相同工作时间内增加产能

滁州瑞林包装取得包装复合膜生产用卷膜装置专利，解决包装膜收卷的褶皱等问题

在信息爆炸时代，如何有效辨别真假信息成为每个人的必修课

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响