当前位置:首页|资讯|微软|OpenAI|GPT-4

微软德国透露多模态GPT-4即将推出,能生成视频|CyberDaily

作者:CyberDaily发布时间:2023-03-10

 CyberDaily:

微软的大招接连,谁能挡得住呀

3 月 9 日,微软德国举办了“AI in Focus - Digital Kickoff”活动,四名微软德国员工详细介绍了像 GPT 系列的大型语言模型(LLM)作为公司和他们的 Azure-OpenAI 提供的一种摧毁性力量。

在活动中,微软德国的 CTO Andreas Braun 随口提到 GPT-4 即将到来,预计下周发布,并表示将具有多模态功能,包括视频。Braun 将 LLM 称为“游戏改变者”,因为它们教授机器理解自然语言,这之前只能被人类读取和理解。

现在,该技术已经发展到了基本“在所有语言中都适用”的程度:您可以用德语提问并用意大利语得到答案。微软(OpenAI)希望通过多模态功能“使模型全面化”。

微软德国的 Clemens Siebler 和 Holger Kenn 提供了实际 AI 使用和当前正在进行的具体用例的见解。Kenn 解释了多模态 AI 的含义,它不仅可以将文本翻译成图像,还可以翻译成音乐和视频。

Siebler 通过用例说明了今天已经可以做到的事情,例如可以录制语音电话,并且呼叫中心的代理商不再需要手动总结和输入内容。

据 Siebler 称,这可以为荷兰一家大型微软客户每天节省 500 个工作小时,该客户每天接收 30000 个电话。他说,该项目的原型在两个小时内创建,单个开发人员在两周内实现了该项目(加上最终实现的时间)。据他说,最常见的三种用例是回答仅对员工可用的公司知识问题,AI 协助文件处理以及通过处理呼叫和响应中的口语进行半自动化处理。

这个项目揭示了 GPT-4 的潜力,它将具有多模态功能,包括生成文本、图像和视频。

然而,该发布也将引发了人们对虚假图像和视频的制作的担忧,例如假新闻、伪造证据和虚假历史记录。因此,一些人呼吁制定更严格的法律和规定来管理 GPT-4 的使用。

虽然 GPT-4 的发布是一个重大的技术进步,将进一步推动自然语言处理技术的发展,但有必要更加关注其潜在的不良影响并采取适当的措施来应对这些影响。

据百度此前官方发布,下周即3月16日将发布其类ChatGPT产品文心一言。

参考资料:

[1]https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1