能听会说，ChatGPT开启新一轮AI助理竞赛

作者：第一财经发布时间：2023-09-26

ChatGPT 人工智能

能听会说，ChatGPT开启新一轮AI助理竞赛

为了鼓励消费者在日常生活中采用生成式人工智能，科技公司不仅竞相推出新的聊天机器人应用程序，而且还推出新功能。

当地时间9月25日，ChatGPT开发商OpenAI公司在一篇博客文章中表示，该聊天机器人将拥有全新的功能，它能听会说，还可以处理图像。

这也是GPT 4大型语言模型推出以来最大的一次功能更新。OpenAI表示，更新后的ChatGPT将在未来两周内向付费用户推出。

ChatGPT功能更新后，意味着它将成为类似于苹果Siri或者亚马逊Alexa这样的语音助理，但功能更加强大。用户可以直接与ChatGPT语音对话，例如请ChatGPT讲一段睡前故事，或者请它设置一个晚餐时的聊天话题。

OpenAI表示，ChatGPT的语音功能是由一种全新的文生语音（text to speech）模型支持的，输入文字便可生成人声，并通过与专业声音演员合作，提供5种不同的语音。

借助图像交互功能，用户可以拍摄周围事物的照片，并要求ChatGPT给出建议，例如分析为何烤箱无法启动，或者提供一份冰箱中食材的菜谱。

OpenAI表示，语音功能最初将仅向iOS和Android应用程序开放，但图像处理功能将在所有平台上提供。

在人工智能语音助理苹果Siri和亚马逊Alexa横空出世大约十年后，ChatGPT等AI大模型带火了具有更大自主权的新一波人工智能助手AI数字代理（AI agent）。

AI数字代理是指能够在人类的指导下执行更复杂的任务，而无需密切监督的人工智能助理，有时也被称为AI“副驾”。硅谷科技公司正在竞相利用人工智能技术的进步，在ChatGPT等大模型上运行AI数字代理的实验系统。

巨头企业也已为此注入数十亿美元的资本。就在ChatGPT新功能发布的同一天，亚马逊宣布以40亿美元投资OpenAI的竞争对手Anthropic。

亚马逊发言人今年早些时候表示，团队正在开发新模型，以使Alexa语音助手更加强大和有用。

近几个月，谷歌和微软也都更新了聊天机器人的新版本，例如微软则在Bing中添加了视觉搜索。

微软CEO萨蒂亚·纳德拉（SatyaNadella）认为，基础模型技术的发展是AI助理从微软Cortana、亚马逊Alexa、苹果Siri以及GoogleAssistant等演进的一次飞跃。在他看来，过去这些数字助理都没有达到最初的预期。

由科技行业领袖里德·霍夫曼（Reid Hoffman）和穆斯塔法·苏莱曼（Mustafa Suleyman）创建的一家名为Inflection AI的公司，于今年6月底筹集了13亿美元资金。该公司正在开发一款私人AI助理，据称可以充当顾问或处理诸如在旅行延误后获得航班积分和订酒店等任务。

不过，功能更强大的AI代理也引发了关于数据隐私安全的争议，尤其是对于人工智能生成的合成声音的担忧，因为这可能会涉及深度伪造（deepfake）。有网络攻击者已经开始探索如何利用深度伪造来渗透网络安全系统。

OpenAI在周一的声明中也承认了这些担忧，不过没有提供有关OpenAI如何使用消费者语音输入的详细信息，或者说明公司将如何保护这些消费者数据。根据该公司的服务条款规定，消费者“在适用法律允许的范围内”对自己的数据拥有所有权。

OpenAI公司CEO奥特曼（Sam Altman）周一在台北的一场论坛上表示，人工智能快速发展会引发政府的监督，但他并不担心政府过度监管，反而担心监管不足。

他表示，未来可能会出现比GPT 4强大1万倍的模型，这些模型可能会接近人类智能，应该受到一些监管。

相关资讯

AI大模型加速涌向手机新一轮技术竞赛再度开启

2023年初，随着ChatGPT爆火，众多科技公司纷纷推出大模型相关产品，当前，国内“百模大战”的下半场战事正酣，但主角已经由互联网大厂变为手机厂商——华为、荣耀、OPPO、vivo以及小米等手机厂商先后以合作或自研的方式推出各自的手机端侧大模型，并强调在大模型的支持下，智能手机的AI能力从智能语音助手向个人智能助理升级，由此也促进了换机...

AI大模型 ChatGPT 华为

每日经济新闻 2023-12-28

“天空”模型或引发新一轮AI“军备竞赛”

参考消息网2月21日报道据美国CNET公司网站2月19日报道，美国开放人工智能研究中心(OpenAI)推出了一款名为“天空”(Sora)的文字生成视频模型，它能够提高生成式人工智能创作的可能性。与Lumiere不同的是，“天空”模型可以生成长达1分钟的视频。

人工智能 OpenAI

参考消息 2024-02-21

手机业进入复苏期 AI引发新一轮技术竞赛

中国手机市场已经确定摆脱了持续下滑的低迷态势。Arm财报中就提到，v9架构正在加速渗透，这正是当前搭载具备AI大模型能力手机的必备要素之一；联发科高管在业绩交流会中也提到，中国智能手机的ASP（平均销售单价）正向高端化发展，该公司业绩也受益于此趋势。

AI大模型

21世纪经济报道 2024-08-13

ChatGPT迎来“炸裂”升级！能看、能听、会说，超级AI助理即将诞生？

据OpenAI介绍，语音输入功能类似于手机上的语音助手，用户只需按下一个按钮，说出自己的问题，ChatGPT就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。随后，用户又询问其工具箱中哪个是所…

ChatGPT OpenAI

格隆汇 2023-09-27

ChatGPT+数字人，能否开启新一轮科技革命？

VRAR星球ChatGPT 可以说是当下科技行业最热的话题。近日，数家虚拟数字人公司都通过官方、媒体或者投资者互动平台表明要将ChatGPT与公司虚拟数字人融合，致力研发出更加智能化、拟人化的虚拟数字人。2月22日，利亚德在互动平台表示，公司旗下子公司北京虚拟动点已开发的数字人平台可以结合ChatGPT的AI语言处理功能，完善数字人的功能。2月21日，天娱数科有关人士向元宇宙NEWS表示，公司的虚拟数字人已经接入ChatGPT等模型，会结合公司现有的虚拟人直播互动、跨境电商等业务应用场景。2月1

ChatGPT 数字人融资元宇宙

VRAR星球 2023-02-28

能听会说，ChatGPT开启新一轮AI助理竞赛

能听会说，ChatGPT开启新一轮AI助理竞赛

推荐体验

相关资讯

AI大模型加速涌向手机新一轮技术竞赛再度开启

“天空”模型或引发新一轮AI“军备竞赛”

手机业进入复苏期 AI引发新一轮技术竞赛

ChatGPT迎来“炸裂”升级！能看、能听、会说，超级AI助理即将诞生？

ChatGPT+数字人，能否开启新一轮科技革命？

近期资讯

年末暖心回馈，总有一款适合你！华为服务回馈礼遇推出多重温暖服务权益

恒为科技：有智能巡检机器人、光伏清扫机器人等产品

共青农场有限公司：开展测土配方施肥守护黑土大粮仓

全球首发Chiplet 国产自驾芯片来了！北极雄芯启明935A成功点亮

宁夏可为申请通信用防信号干扰设备专利，提高该装置的使用寿命

2024年中国工程热物理学会工程热力学与能源利用学术会议在厦门举办

掌握气泡图制作技巧：数据可视化的实用指南

家电升级优选，美的MB100V33B：波轮洗衣机性价比之王，不足千元

联想Legion Go S掌机规格曝光搭载AMD锐龙Z2 Go

英伟达中端显卡抢先看，RTX 5070 / Ti 规格曝光

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响