金融投资报记者 陈雨禾
在人工智能领域风头正盛的OpenAI,如今又有了大动作。
在5月14日举办的线上“春季更新”活动中,OpenAI发布了新旗舰生成式AI模型GPT-4o。相关话题,如“新版GPT可以和人视频互动”“GPT-4o可检测人的情绪”等,相继冲上热搜。
西南交通大学计算机与人工智能学院副教授、博士生导师邢焕来在接受金融投资报记者采访时表示,GPT-4o不仅拥有全面的多模态能力、实时交互性,也具备对语音和情感的深入理解,或将为用户提供一个更加强大、更灵活且易于接触的AI工具。
GPT-4o性能显著提升
据OpenAI官网介绍,GPT-4o中的“o”代表Omni,意为“全能”。作为OpenAI最新发布的旗舰模型,GPT-4o继承了GPT-4的核心功能,并在多个方面进行了显著的优化和提升。
具体来看,在多模态交互方面,无论输入还是输出,GPT-4o都可以综合处理及生成文本、音频和图像的任意组合,因此可以应对更复杂的任务。
相比此前版本,GPT-4o也拥有更好的实时交互能力,与使用者对话基本无延迟,可在232毫秒内响应音频输入,平均响应时长仅320毫秒(此前GPT-3.5为2.8秒,GPT-4为5.4秒),和人类反应速度类似。
在网络直播中,GPT-4o展示了实时推理文本、音频、视觉(图像和视频)等的能力。尤其是在视觉感知方面,模型可以通过摄像头识别并描述画面;在语音方面,即使对话中途被打断,也能继续下去。这些都是实现逼真语音对话的标志,也是当前众多人工智能语音助手普遍面临的技术难点。
更逼真的则是,GPT-4o还被认为拥有一定的情绪感知能力,不仅可通过识别图像或声音感知人的情绪,模型自己也能在一定程度上表达自己的“情绪”,大幅提高了语音交互的质量和准确性。
香颂资本董事沈萌对金融投资报记者表示,“GPT-4o的发布,一方面会掀起新一波AI概念热以及相应的军备竞赛;另一方面,对提高OpenAI的估值也有积极作用。”
免费背后行业“开卷”
金融投资报记者注意到,GPT-4o发布后更受关注的,还是该模型会对所有用户免费开放,无需付费即可使用,提高了其普及性和可访问性。
邢焕来表示,GPT-4和其他高级模型通常仅对付费用户提供,限制了普通用户的直接接触,GPT-4o的免费开放则释放了一些重要信号:
一方面,随着各类大模型的问世,之前依赖的付费订阅、API调用收费的盈利模式增长疲软,GPT-4o的免费开放也意味着OpenAI可能通过扩大用户基础来获取更多的收入,探索新的盈利模式。
另一方面,随着AI市场竞争的加剧,通过提供免费的先进技术,OpenAI可以吸引更多用户使用其产品,进而增加其在AI市场上的影响力和地位。这也意味着OpenAI可能正在加大研发投入,不断推出更具创新性和领先性的产品,以保持其在激烈竞争中的优势地位。
对于OpenAI本身来说,将GPT-4o模型免费开放的决策也是非常具有魄力的,会带来用户基础扩大、各类成本增加、激发创新和应用的多样性、数据和反馈的增加等多方面的影响。尤其是GPT-4o免费开放后,OpenAI原有的模型订阅和API付费调用的盈利模式也会受到影响,这也将逼迫其必须尽快找到新的盈利模式。
事实上,随着GPT-4o的发布,市场对它的讨论也不全是看好的声音。
5月14日上午,猎豹移动董事长兼CEO、猎户星空董事长傅盛发布短视频评价称,一方面,OpenAI发布应用恰恰说明了应用在人工智能领域大有可为,每一个创业者都应该去好好地做人工智能应用;另一方面,如果不计成本地堆积参数,提高所谓的大模型能力,肯定是容易遇到困难的。目前看来,GPT-5.0可能还要难产一段时间。
值得注意的是,在OpenAI推出“对所有用户免费开放”的GPT-4o之前,不少大厂的AI产品,如Deepseek、claude3、GLM、文心大模型等,都呈现出了降价趋势。因此,在不少观点看来,在大模型行业竞争日渐加剧的情况下,叠加相关技术迭代优化且成本下降的趋势,AI领域新一轮的技术战和价格战或将随之开启。
国内AI市场面临挑战
5月14日,A股人工智能板块逆市上涨,其中虚拟人、多模态模型、AI算力等概念股涨幅居前,相关公司也成为市场关注焦点。
关于GPT-4o对国内大模型行业的影响,邢焕来表示,这是机遇也是挑战。
首先,从技术方面来看,OpenAI成功为国内大模型行业提供了一条可能的发展路径:三模态端到端实时输入输出是可行的,并且能极大地提高模型的情感理解能力。
其次,在AI应用领域,由于GPT-4o的实时响应能力显著提升,意味着AI的交互体验将会更加流畅,这在一定程度上扩展了AI的应用范围。
此外,GPT-4o能更好地支持多模态,并且有着强大的用户交互能力,这也使得AI的应用领域更加丰富,并且能大幅提高如手机语音助手等应用的业务能力。
在邢焕来看来,GPT-4o的发布同样带来了挑战。美国企业在AI产业布局上主要有技术生态优势、高质量大数据优势、拥有较为完善的科技风险投资市场等优势。这些优势使得他们在AI领域的竞争力更强,对国内AI产业形成了压力。
除了有OpenAI的GPT-4o发布以外,其他巨头在人工智能领域的布局也备受关注。
例如,美东时间5月14日13时(北京时间5月15日1时)举行的谷歌2024年I/O开发者大会,其中包括安卓15等涉及人工智能的内容就成为了市场关注的焦点;另一边,苹果公司即将官宣的人工智能领域的最新进展也受到关注。有消息称,苹果公司将基于一个全新的生成式AI系统对Siri进行升级。
随着大语言模型性能的不断提高,以及AI技术的发展,其中可能存在的数据隐私安全问题、技术伦理问题和社会问题等,同样引发关注。
“随着AI在我们日常生活中占据的比重越来越高,数据隐私和安全问题的重要性越发凸显。如何确保用户数据的安全和隐私,将成为一个重要议题。”邢焕来表示,“在AI技术发展带来便利的同时,也会在一定程度上代替人力在某些传统领域上的地位,比如自动化业务和在线客服等,从而影响传统岗位的就业情况,引发就业、伦理等社会问题。”