当前位置:首页|资讯|英伟达|谷歌|OpenAI|AI音频|AI聊天机器人

英伟达ChatRTX迎0.3版本更新 新增照片搜索、AI语音识别等功能

作者:3DMGAME发布时间:2024-05-02

原标题:英伟达ChatRTX迎0.3版本更新 新增照片搜索、AI语音识别等功能

英伟达今日宣布,旗下AI聊天机器人ChatRTX进行0.3版本更新,此次更新不仅增加了对谷歌的Gemma、ChatGLM3和OpenAI的CLIP等多种人工智能模型的支持,还首次集成了先进的Whisper语音识别系统,为用户带来前所未有的智能交互体验。

英伟达今年三月曾公开AI聊天机器人ChatRTX,使用者可以在有着英伟达RTX技术支援的Windows PC和工作站上,与储存在本地端的资料互动。ChatRTX利用检索增强生成、英伟达TensorRT-LLM软体与英伟达RTX加速等技术,将聊天机器人功能带至有着RTX技术支援的Windows PC和工作站上。在LLM的支援下,使用者可以透过ChatRTX查询他们的笔记和档案,且由于ChatRTX在使用者装置本机端运行,能够快速生成相关回应。

英伟达表示,最新版本加入支援其他LLM,包括由谷歌训练出最新的开放式、可在本地端运行的Gemma。Gemma是Google使用与自家Gemini模型相同的研究和技术,专为负责任AI开发而打造的模型。ChatRTX现在也支援基于通用语言模型框架的开放式中英双语ChatGLM3大型语言模型。

英伟达指出,由于支援OpenAI的对比语言和影像预训练技术,使用者能与影像资料进行互动。经过训练和细化后的CLIP神经网络,从自然语言监督中学习视觉概念。也就是说,这个模型会辨识在影像集里「看到」的东西。因ChatRTX支援CLIP,使用者可透过单字、术语和短语,与装置本机端的相片和影像进行互动,无需使用复杂的诠释资料标记。

另外,新版本的ChatRTX还让使用者可以用自己的声音与资料进行聊天。由于有支援使用AI处理口语的自动语音识别系统Whisper,使用者可以在应用程式上用语音进行查询,ChatRTX将以文字加以回应。这意味着用户不再局限于键盘输入,而是可以通过简单的语音指令来与机器人交互,查询本地数据,享受更为自然和高效的沟通方式。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1