当前位置:首页|资讯|ChatGPT|编程

AI见闻日报:被曝光!BING和ChatGPT都要升级了,360多模态来了 | 见智研究

作者:华尔街见闻发布时间:2023-06-13

原标题:AI见闻日报:被曝光!BING和ChatGPT都要升级了,360多模态来了 | 见智研究

今日要点

  1. 微软Bing要升级识图功能;
  2. ChatGPT上传文件更新遭泄露;
  3. Windows 12要来了;
  4. 360智脑4.0发布,从对话进入多模态;
  5. Reddit 要API收费,训练语料成本大幅上升;
  6. 又有音频新应用,每人都可以定制自己的AI语音克隆;
每日见智AI

1、微软Bing要升级识图功能

有Reddit网友发现,Bing的界面上突然就出现了个上传图片的选项。据说,上传一张图片之后,Bing什么都能干。不管是编程写代码、做题作图,甚至看病,通通不在话下。(似乎还在小规模测试)

2、ChatGPT上传文件更新遭泄露

ChatGPT的新功能遭泄露?一位Reddit用户在挖掘源代码时遇到了一个新的ChatGPT界面,就像他们在发布前一周发现“聊天共享”功能。泄露的屏幕截图展示了“工作区”,允许用户创建ChatGPT可以轻松记住的配置文件,并且似乎还暗示了文件上传这一功能。这一发现也符合 OpenAI 承诺未来推出 ChatGPT 业务变体的计划。此外,还讨论了新的隐私措施的推出,新业务ChatGPT不再使用用户数据来训练模型。

见智点评:无论是Bing还是 ChatGPT的业务升级都符合市场的预期,在人工智能助手迭代速度越来越快的今天,识别图片和文件也势必要成为人工智能助手升级的重要方向,上传文件功能的开通更能够增加用户对文本操作的便捷性;另外让机器理解图片的基本内容是比较容易的,但是理解深层引申含义恐怕还比较难。

3、Windows 12要来了

根据微软内部测试的情况,Windows 12可能具备一个外观不同的桌面和没有系统托盘的浮动任务栏等独特的功能根据微软内部测试的情况,Windows 12可能具备一个外观不同的桌面和没有系统托盘的浮动任务栏等独特的功能。

新系统还将拥有深度集成的人工智能功能,而智能Snap UI和Windows Copilot只是其中一部分。尽管目前还没有官方的消息确认,但这些传闻已经让许多Windows用户对Windows 12充满了期待。

另外,微软还宣布推出 NewBing 桌面语音聊天功能,在 BingChat 对话框中增加语音输入按钮,只需单击 BingChat 对话框上的麦克风,即可用语音向 NewBing 提问。

见智点评:Windows12预计将全面结合AI功能,大概率将改变用户对操作系统的长期使用习惯,AI功能集成到操作系统中将极大的提高工作效率。微软此前还宣布将在6月开始在Windows11中提供Copilot,让用户尽早使用AI工具,并为之后的操作系统全面AI化进行过度。

4、360智脑4.0发布,从对话进入多模态

360智脑大会发布了最新4.0版本,目前已经具备多模态功能,包括文生图、图生图、图生文、视频理解和文生视频。360全家桶也积极全面接入360智脑,包括安全卫士、浏览器和桌面等场景。另外值得关注的就是数字人对话功能非常有趣,并且可以定制自己的数字人。预计下个月会发布5.0插件版本

见智点评:国内大模型的迭代速度非常快,特别是多模态竞争上未来一定是重要领域,将图片、视频、语音等多场景结合才能够让AI工具发挥出更出色的效果。另外,数字人现在也是非常重要的领域,由于成本的大幅下降,定制自己的数字人也非常方便,这将极大的推动数字人应用的大范围应用落地。

5、Reddit 要API收费,训练语料成本大幅上升

Reddit 表示将在 7 月 1 日开始对现有 API 收费,届时第三方 Reddit 都将无法正常使用。在 Reddit 新政策下,第三方每调用一千次 Reddit 的 API 需要支付 0.24 美元(约 1.71 元人民币);

知名第三方 Reddit App,例如 RIF、ReddPlanet、Sync 也宣布将在同一天停止服务。RIF 表示自己的营收远远无法承担 Reddit API 所要的费用。还包括自动驾驶开发平台Apollo。

见智点评:Reddit是一家知名的在线论坛公司,同时给企业提供API用于访问数据,第三方公司可以创建与Reddit相关的应用程序。

即便是收到了众多第三方用户的反对,但Reddit预计仍旧坚持推行收费支付,因为目前Reddit还没有盈利,随着API调用量的激增,训练语料成本大幅上升,Reddit也需要有一定的收入来继续运营数据从而提供商业服务。

在品牌影响力已经足够大的时候,长期免费并不符合公司的发展路径,毕竟不是公益企业,一切运营都需要开支。短期来看,公司的用户量肯定会受到影响,但是也会筛选出长期合作用户以提供更优质的服务。

6、又有音频新应用,每人都可以定制自己的AI语音克隆

PlatTH可以为用户定制免费的AI语音克隆,准确率高达99%。操作简单,无需专业设备,只要上传2-3小时的语音,便可以得到自己的克隆声音。

见智点评:超逼真的AI语音克隆适用于众多视频生产和游戏领域。比如制作抖音短视频、B站长视频、还可以创建人工智能博客等等,AI工具的出现让视频生产的效率获得极大的改变。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1