IT之家8月13日消息,阿里通义千问开源Qwen2-Audio系列的两个模型Qwen2-Audio-7B和Qwen2-Audio-7B-Instruct。语音聊天:用户可以自由地与Qwen2-Audio进行语音互动,而无需文本输入。官方在一系列基准数据集上进行了测试,Qwen2-Audio超越了先前的最佳模型。
通义千问
IT之家 2024-08-13
马斯克官宣Grok-2!性能秒杀GPT-4?是否开源成焦点雷科技2024-08-13 11:00发布于广东科技领域创作者全文2743字,阅读约需8分钟,帮我划重点划重点01特斯拉CEO马斯克宣布
马斯克GPT-4
雷科技 2024-08-13
智通财经APP获悉,长江证券发布研报认为,OpenAI新推出的模型API全部支持结构化输出,提高AI输出可靠性,简化开发流程,从而使得开发者可以精确控制AI模型的输出格式,确保数据的准确性和一致性。国内厂商推动多模态大模型开源,或将加速AI技术的创新和发展。
OpenAI
金融界 2024-08-13
近日,国外的AI视频生成模型竞争依然在不断升温,国内的AI视频模型赛道也迎来了前所未有的“内卷”潮。 7月26日,智谱清影(Ying)AI视频生成工具正式上线,这款由智谱AI推出的视频生成工具,允许用户通过输入文本描述或上传图片,在大约30秒内生成一段6秒长的视频。 而在8月6日,智谱AI宣布清影背后的视频生成模型——CogVideoX正式开源。 或许很多人看到这里就会发出疑问,智谱清影和CogVideoX是什么关系?下面来说一下: CogVideoX:这是智谱AI自研的视频生成模型的技术基础。CogVi
AI视频
302AI 2024-08-12
每经AI快讯,开源证券08月12日发布研报称,维持鼎捷软件(300378.SZ)买入评级。评级理由主要包括:1)公司发布2024年中报,扣非利润高增长;2)中国大陆地区经营稳健,中国台湾地区AI应用高增长,东…
AIGC
每日经济新闻 2024-08-12
国泰君安发布研报称,大模型侧开源能力快速提升,轻量化趋势显著。继续看好AI技术发展对内容产业的推动作用。随着AI大模型开源化、轻量化,以及视频和语音等模态的快速进步,部分应用场景有望发生变化。
AI大模型
金融界 2024-08-12
深度学习领域想发论文,但导师放养,找不到创新点?那你一定不要错过谷歌大佬总结的这8个绝招,论文闭眼发!具体看,大佬把思路分为传统深度学习和大模型时代两个阶段!传统时代方法主要有:微改网络结构 + 旧数据集 = 我发明了新的网络结构旧网络结构 + 新数据集 = 我开源了新的数据造福人类跑了一堆微改的网络结构,找到那个0.3%领先的 = 我大大改进了现有网络结构旧网络结构 + 旧数据集 + 新的应用领域 = 我开辟了深度学习在X领域的应用旧网络结构 + 旧数据集 + 新的评估方法 = 我认为这样评估模型更合理
深度学习谷歌
迪哥谈AI 2024-08-11
说起**文生语音模型**,最广为人知的肯定是 **OpenAI 的 Whisper**,之前试过确实
OpenAIWhisper
三金得鑫 2024-08-11
据了解,这个模型已经支持在HuggingFace的diffusers库中进行部署,操作也是非常简单,只有2步:智谱AI这次不仅是将视频生成模型开源,背后的技术报告也是一并被发布了出来。他们还微调了一个基于Co…
SoraGitHubHugging Face
量子位 2024-08-10
点评:此次发布的标准汇集了全球AI安全领域的专家智慧,填补了大语言模型和生成式AI应用方面安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强…
生成式AI数字人大语言模型
未来图灵 2024-08-10
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1