ChatGPT迎来“炸裂”升级！能看、能听、会说，超级AI助理即将诞生？

作者：格隆汇发布时间：2023-09-27

ChatGPT又迎来大升级，这次是“多模态”，能开口说话，识别物体。

当地时间周一，OpenAI宣布，将在ChatGPT推出新的语音和图像功能，新功能将于未来两周内面向Plus和企业用户推出。

OpenAI介绍称，ChatGPT推出的语音和图像功能提供了一种新的、更直观的界面，允许用户进行语音对话或向ChatGPT显示用户正在谈论的内容。新功能可以给用户提供在生活中使用ChatGPT的更多方式：

用户可以在旅行时拍下一张地标的照片，并就它的有趣之处与ChatGPT进行现场对话；
当用户在家时，拍下冰箱和餐具室的照片，ChatGPT可以给出晚餐食谱；

如果用户在帮自己的孩子做一道数学题，拍张照片，圈出题集，ChatGPT会给出提示。

新功能有哪些用途？

据OpenAI介绍，语音输入功能类似于手机上的语音助手，用户只需按下一个按钮，说出自己的问题，ChatGPT 就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。

OpenAI 还开发了一种新的文本转语音模型，可以根据几秒钟的样本语音，生成与之相似的人声。用户可以从五种选项中选择 ChatGPT 的声音，而且这种模型还有更多的潜在用途，包括将播客翻译成其他语言，同时保留播客主持人的声音。

OpenAI表示，它与配音演员合作，共同构建了该功能的文本到语音AI模型。

图像输入功能则类似于 Google Lens，用户可以拍摄自己感兴趣的事物，并上传到 ChatGPT 中。ChatGPT会尝试识别用户想要询问的内容，并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题，或者配合语音或文本输入来进行交流。

OpenAI给出的例子是，用户拍了已涨自行车的图片，询问ChatGPT如何调低座椅，根据用户的提问，ChatGPT很快识别出车座调节类型和需要的工具。

随后，用户又询问其工具箱中哪个是所需的工具，ChatGPT也是成功识别，并提示用户需要拿哪一个尺寸。

设想即将实现？

可以看出，ChatGPT的功能越来越强大，非常智能。此前，OpenAI首席执行官Sam Altman和比尔·盖茨都曾对ChatGPT未来的应用前景进行设想。

Altman曾私下告诉开发者，希望将ChatGPT打造成“超级智能个人工作助理”，可以根据个人及工作需求执行多种任务，如按照用户的风格起草邮件或文件，提供相关业务的最新信息。

盖茨也曾表示，技术竞赛将推动顶级AI助理的诞生，颠覆现有生产力，可能会从根本上改变用户的行为，乃至取代搜索和购物网站。

不过，ChatGPT也提示，这些功能也带来了新的风险，例如恶意行为者可能冒充公众人物或实施欺诈。

ChatGPT迎来“炸裂”升级！能看、能听、会说，超级AI助理即将诞生？

推荐体验

相关资讯

ChatGPT重大升级，能看能听还会说，更像人了！

OpenAI官宣推出多模态ChatGPT 能看、能听、还会说

能听会说，ChatGPT开启新一轮AI助理竞赛

重磅升级，“现在，ChatGPT 能看、能听、能说了”

ChatGPT App重大进化！能看能听还会说，多模态模型细节同时公布

近期资讯

广东晟一智能科技取得具备环形拍齐功能的四面拍齐整理机专利，支撑横梁坠落可防坠

金杯电工电磁线取得码垛机械手及工字盘码垛设备专利，防止盘状物在移栽过程中脱出取料轴

无锡理奇智能装备取得一种粉料无泄漏自动对接装置专利，能够实现移动容器和固定容器之间自动对接，粉料无泄漏，同时减少中间管道连接，节省布局空间

上海炫联取得一种吨包抓取叠放设备专利，提高吨包在卸料时位置的准确性

中科微至取得螺旋旋转分盘落框机专利，保证最下端托盘缓慢降落至下层输送线

东莞市微控智能科技取得轮式供料机专利，解决现有供料机取料问题

云南电网输电分公司取得基于深度编解码融合网络的 SAR 遥感图像水域分割方法专利

河南盛鑫五金制品有限公司取得一种产品上料机专利，提高上料效率

东马（广州保税区）油脂化工有限公司取得清洁剂生产用输送装置专利，方便向反应釜进行投料

山东华菱电子取得矩形料盘自动摆正及分盘码垛装置专利，能够对承托物料的托盘姿态进行自动摆正，避免盘体内物料移位

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响