谷歌“Her”抢跑落地 OpenAI语音AI仍在“hold on”

作者：21世纪经济报道发布时间：2024-08-14

谷歌 OpenAI

21世纪经济报道记者孔海丽、实习生刘清怡北京报道

北京时间8月14日凌晨，谷歌在“Made by Google”大会上正式发布了智能语音助手Gemini Live。这一功能直接挑战OpenAI的GPT-4o语音模式，并标志着人工智能交互向更加自然、通用和用户友好的方向又迈进了一步。

根据谷歌的介绍，用户可以与Gemini Live进行自由流畅的对话，而不是通过传统的输入和输出设置。

在对话过程中，用户可以打断以询问更多细节，或者暂停一段时间后再继续。

为了使对话更加自然，谷歌还提供了十种声音以供用户选择。谷歌称，“这就像你的口袋里有一个伙伴，你可以和它谈论新想法或练习重要的对话。”

Open AI此前发布的GPT-4o高级语音模式，也允许用户在对话过程中打断，并能感知和回应用户的情绪波动。在语音设置方面，Open AI提供了四种声音，均与专业的配音演员合作制作。

此外，谷歌还将Gemini Live与其他应用程序和工具连接。谷歌表示，将在未来几周推出Keep、Tasks、Utilities、Calendar、YouTube Music等扩展功能。

谷歌描述了这些功能的具体应用场景。比如用户需要举办一场晚宴，可以让Gemini Live找到特定的食谱，并把食材添加到Keep购物清单中，还能定制一份“让人想起90年代末”的歌单；再比如只需要拍一张音乐会海报的照片，Gemini Live就可以回答用户当天是否有空，并提醒用户买票。

不过，在“Made by Google”大会现场演示Gemini Live功能时，却出现了一点小插曲。谷歌高管Dave Citron询问Gemini Live他的日程表上有没有活动，接连尝试了两次Gemini Live都没有响应，直到第三次换了一个设备才演示成功。

目前，谷歌已向Android手机上的Gemini高级订阅用户提供英语版，并将在接下来的几周内扩展到iOS上，同时提供更多语言模式。谷歌发布的最新款Pixel 9系列手机也搭载了Gemini Live功能。

业内人士认为，Gemini Live的发布是人工智能交互发展的一个重要里程碑。通过引入语音中断和选择功能，谷歌既是在与OpenAI竞争，也是在推动人机交互的方式，从而改变人工智能聊天机器人市场的竞争格局，倒逼其他公司创造出更多自然、实用、吸引人的人工智能助手。

同时，人机交互的创新发展也带来了新的问题和挑战。例如，人工智能将如何快速处理话题变化，同时保持上下文的统一和相关性？如何在不丢失重要线索的情况下处理干扰信息？更重要的是，随着人工智能的深入发展，其与现实生活的边界在哪里？

而OpenAI早在3个月前就已经公开介绍过的GPT-4o，至今尚未完全落地。8月9日，OpenAI发布了一篇关于安全性的博客文章，详细介绍了公司在开发GPT-4o时所做的安全努力，并探讨了这些技术可能对社会带来的风险。

OpenAI在该报告中指出了人工智能的类人社交模式可能造成的风险。OpenAI认为，用户可能会与人工智能建立社交关系，而减少对人类互动的需求。这有利于孤独的个体，但会影响健康的人际关系。

OpenAI透露，在GPT-4o的早期测试时，他们观察到用户与模型的互动语言开始出现微妙的变化，例如，“这是我们在一起的最后一天”等等，这种看似无害的表达，背后可能隐藏着更大的问题。

此外，OpenAI还提到，GPT-4o有时会无意间生成模仿用户声音的输出，这意味着，AI语音引擎可能会被用来欺诈。

而这些安全问题，也是OpenAI把控GPT-4o落地节奏的原因之一。至于谷歌Gemini Live是否解决了类似的安全隐患，并未披露。

所有与安全相关的隐患，无论是我们能够意识到的，还是“潘多拉魔盒”附带的更多可能性，都是人工智能事业需要进一步解决的问题，以保证“技术的进步是为了服务于人类”。

更多内容请下载21财经APP

谷歌“Her”抢跑落地 OpenAI语音AI仍在“hold on”

推荐体验

相关资讯

OpenAI 突然推送推送高级语音模式「Her」，又抢了谷歌风头

谷歌版Her抢跑，一键召唤Gemini，全球52亿终端被颠覆

OpenAI教谷歌做语音助手，新模型GPT-4o科幻级语音交互，零延迟满情绪，AI进入HER时代

苹果与谷歌和OpenAI就iPhone AI仍在进行谈判

OpenAI谷歌苹果再燃AI争霸战，谁将担纲《Her》时代王者？

近期资讯

智能座舱需求管理实践：从混沌到有序

UX流程全景（4）：初级调研之实践心得

国网山东电力科院申请传像束与镜头耦合对准专利，实现光纤传像束与镜头快速耦合自动调节

新媒体矩阵：车企数字化转型的必由之路

沈阳鸿业玻璃容器取得伺服反转装置结构专利，能实现对产品进行反转调节的效果

东莞米思取得手动测角仪倾斜角度弧形滑台专利，能更快速调节活动滑台倾斜角度

从 0 到 1 剖析 OTWB 中的 T 系统：TMS实战分享

探店经济，新风口还是泡沫？深度解析背后的商业逻辑

供应链金融在物流平台领域创新发展案例（二）

微信不想被“捧杀”

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响