当前位置:首页|资讯|ChatGPT|OpenAI

ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

作者:科技真探社发布时间:2024-01-03

原标题:ChatGPT新版本来了,引入图像和语音,更强的多模态交互能力

9月25日,OpenAI发布了新版本的ChatGPT,允许用户通过语音、图像的方式,与ChatGPT进行互动。

OpenAI展示了一个例子。

用户给它发送了一张自行车照片,问它「如何调整座椅高度」,ChatGPT给出了相关的操作步骤,提到要找到对应的快拆杆,需要什么工具等等;然后用户又发送了一张自行车座椅局部的照片,问图中的零件是快拆杆吗?ChatGPT回答不是,然后告诉用户使用什么样的工具,如何操作这个零件,调整座椅高度。

更厉害的来了,用户给ChatGPT发送了自己工具箱的照片,询问ChatGPT,工具箱里有他所需的工具吗?ChatGPT看了一眼照片回答道,用户所需的工具就在工具箱的什么什么位置。

毫不夸张的说,这样多模态的分析、交互能力已经超越了很多AI工具,进一步扩大了ChatGPT的应用范围。

另外在语音方面,像很多儿童陪伴机器人一样,ChatGPT可以给孩子讲睡前故事,了但不同的是,他可以根据故事内容,回答孩子提出的问题,交互能力、理解能力会更强,而且OpenAI为此请来了五名专业配音人士,提供了五种不同的声音选择。

未来两周,这些能力会提供给ChatGPT的付费用户。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1