当前位置:首页|资讯|苹果|OpenAI

GPT-4o来了!可实时“秒回”,还能读懂人类情绪

作者:新快报发布时间:2024-05-16

据央视财经报道,当地时间5月13日,OpenAI公司在美国加州举办新品发布会,推出新的旗舰AI模型,名为GPT-4o。

跟此前的版本相比,GPT-4o最大的特点是增加了语音交互,并且号称和一些同类竞品相比,它的响应时间更快,可以减少延时,更接近和真人对话的节奏。OpenAI表示,GPT-4o功能向所有用户开放,不过语音功能的上线还要等待数周。

GPT-4o的一些应用场景:

▲让GPT-4o充当实时翻译。

▲让GPT-4o给孩子辅导数学。

▲让两个GPT-4o和声哼唱。

像真人一样语音聊天

还能读懂人类情绪

OpenAI官网介绍,GPT-4o中的“o”代表“omni”,意为“全能”,称它向更自然的人机交互迈进了一步,因为它接受文本、音频和图像的任意组合作为输入内容,并生成文本、音频和图像的任意组合输出内容。

据路透社报道,相比先前版本,GPT-4o与使用者对话基本无延迟,和人类反应速度类似。即使对话中途被打断,也能继续下去。这些都是实现逼真语音对话的标志,也是当前众多人工智能语音助手普遍面临的技术难点。

它还可以识别用户声音中展现的情感,甚至实时根据用户的需求来使用不同情感风格的声音。发布会上,主持人与ChatGPT寒暄几句,它能够从对方的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。

此外,GPT-4o还提高了ChatGPT的视觉能力。在当天的发布会现场演示中,这款生成式人工智能工具利用其视觉和语音能力,指导演示者在纸上逐步解出一道方程题,而不是直接给出答案。它还展示了英语与意大利语互译、用自拍照片识别情绪等能力。当一名演示者告诉它,自己正展示它是“多么有用和不可思议”时,它回答道:“哦,快别说了,怪害臊的。”

开放人工智能研究中心首席执行官萨姆·奥尔特曼当天在博客中写道,GPT-4o就像“电影中的人工智能”技术,“与电脑交谈一直让我感觉不自然,现在自然了”。

用户可以免费试用

开放人工智能研究中心首席技术官米拉·穆拉蒂在当天活动中说,GPT-4o将于今后几周内上线,用户可免费试用。

ChatGPT原有付费用户将获得新版本更多使用权限,其消息数量使用上限是免费版的5倍,当免费用户用完消息数量后,ChatGPT将自动切换到 GPT-3.5。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。

路透社报道,开放人工智能研究中心希望以GPT-4o在激烈的人工智能技术竞争中保持领先。该公司2022年发布ChatGPT后,短时间内每月活跃用户增至1亿。然而,研究机构西米勒网络公司的数据显示,去年以来ChatGPT用户人数呈现过山车式变化,近期才重回去年5月巅峰时期的水平。

生成式AI市场竞争激烈

近年来,开发更人性化、功能更强大的生成式人工智能工具竞争激烈。

谷歌母公司字母表公司拟于14日召开谷歌开发者年度会议,预计届时将展示谷歌开发的相关产品。硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分别投资开发了聊天机器人Grok和Pi,将拟人化特点作为产品主攻方向。

在英国广播公司看来,GPT-4o能够结合文本、音频和图像内容瞬间做出反应,目前在竞争中仍处于领先地位。

新的Siri将来自OpenAI?

据外媒报道,苹果公司已与OpenAI达成协议,在iPhone上使用其技术,这是将人工智能功能引入其设备的更广泛努力的一部分。

据悉,在苹果公司软件工程高级副总裁Craig Federighi和苹果公司机器学习与人工智能战略高级副总裁John Giannandrea花了数周时间测试ChatGPT后,发现Siri已经过时,苹果公司正计划将生成式人工智能作为一个支柱项目,将把生成式人工智能引入iPhone。

有知情人士表示,苹果公司与OpenAI一直在敲定在苹果下一代iPhone操作系统iOS 18中使用ChatGPT功能的协议条款。苹果同时还与谷歌就授权Gemini聊天机器人进行了谈判。这些讨论尚未达成协议,但仍在进行中。

来源:综合央视财经(记者:张曼曼)、新华社(记者:袁原)、潮新闻(记者:何泠瑶)、澎湃新闻(记者:秦盛)、封面新闻(记者:边雪 马晓玉)

编辑:张依然

校对:吴习


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1