鞭牛士报道,3月23日消息,据外电报道,Sam Altman可能正在努力挑战苹果的 Siri 和亚马逊的 Alex 语音助手。
OpenAI 已提交商标申请,旨在构建数字语音助手和语音引擎,这表明它可能会发布新产品。
该申请于周二向美国专利商标局提交,一天前,Sam Altman 接受了采访,他在采访中表示,OpenAI 在即将推出的 GPT-5 之前还有许多其他重要的事情要发布。
这些功能可能不会实现,因为公司经常为从未见过世面的想法提交商标申请。然而,据Business Insider 此前报道,OpenAI 预计将在年中发布其 ChatGPT 模型的实质性更好升级。
在接受播客莱克斯·弗里德曼 (Lex Fridman)采访时,奥特曼表示:我们今年将发布一款令人惊叹的新模型。我不知道我们会怎么称呼它。我们将在未来几个月内发布许多不同的东西,我认为它们会很酷的。
他补充道:我认为,在我们讨论类似 GPT-5 的模型(无论是叫这个还是不叫那个,或者比你对 GPT-5 的期望稍差一点或好一点)之前,我认为我们有很多其他重要的事情要先发布。
据该公司网站介绍,该公司尚未向用户提供数字语音助手,但它确实有一个将语音转换为文本(称为 TTS)的 API 。它还具有称为 Whisper 的通用语音识别模型。
OpenAI 还于 10 月份为其未来模型提交了商标申请,包括GPT-6和GPT-7。
GPT-6 的申请包括模拟对话、出于机器学习目的共享数据集、预测分析以及能够学习分析、分类并针对数据暴露采取行动的分析算法。
GPT-7商标申请涵盖使用人工智能进行音乐生成、将文本和数据文件转换为软件代码以及创建和生成软件代码的软件。两项申请仍在审查中。
不过,专利局可能不会授予这些商标,就像二月份那样,它拒绝了OpenAI 申请GPT商标的尝试。该机构表示,这是一个广泛使用的缩写词,仅是描述性的,因为它的意思是生成式预训练变压器。
语音工程师商标申请正在等待审查员的审查,拟涵盖以下10个领域的软件:
构建数字语音助手
语音和语音识别、处理语音命令以及文本和语音之间的转换
处理语音命令以及文本和语音之间的转换
自动语音识别和生成
基于自然语言提示、文本、语音、视觉提示、图像和/或视频生成语音和音频输出
响应用户提示生成音频和/或语音
基于机器学习的自然语言和语音处理
多语言语音识别、翻译和转录
使用人工智能自动进行文本到语音和文本到音频的转换
语音服务交付的发展
OpenAI 没有立即回应置评请求。