OpenAI最近宣布,将在接下来的几周内逐步推出新的旗舰AI模型GPT-4o,并将免费向所有用户开放。该模型在继承了前代产品GPT-4的智能基础上,对语音、文本和图像处理能力进行了全面提升。
据 OpenAI 首席技术官 Muri Murati 在总部的一次演讲中提到,GPT-4o 不仅能处理混合的图文信息,还增加了语音处理功能,能够理解和合成语音信息。此次更新使得 GPT-4o 在对话响应速度上有了显著提升,展示中 GPT-4o 能够在提问结束后几乎实时回应,并通过文本到语音技术,使对话更自然。
演示中还展示了 GPT-4o 根据指令变更语调的能力,可以从戏剧性夸张到冰冷机械的转变,并演示了其唱歌功能。这标志着 AI 技术在模拟和理解人类语音方面迈出了重要步伐。
以前 OpenAI 的新模型通常是付费使用的,但这次的 GPT-4o 将向所有用户免费开放,付费用户将享有更高的调用额度。这一政策的改变可能会对 AI 技术的普及和应用产生重要影响。