当前位置:首页|资讯|OpenAI|ChatGPT

【汇正财经】迎看、听、说重磅升级,多模态大模型渐成趋势

作者:汇正财经发布时间:2023-11-11

原标题:【汇正财经】迎看、听、说重磅升级,多模态大模型渐成趋势

事件:美东时间9月25日,OpenAI在官网宣布,对ChatGPT进行重磅升级实现看图、听声音、输出语音内容三大功能。

这是OpenAI实现AGI(通用人工智能)战略重要技术环节。未来两周,OpenAI将向Plus和企业版用户提供看、听、说功能。语音功能将在iOS和Android上使用,图片识别全平台可以使用。

⚫ 图像方面,用户可以通过向其展示一张或多张图片提问,或分析复杂图表得出数据,还可以使用APP中的绘图工具高亮标注图中的特定部分。在同日发布的一篇论文中,OpenAI将这一能看图的模型称作GPT-4V(ision)。

⚫ 语音方面,OpenAI与专业配音演员合作,提供5种不同的声音。另外公司还与Spotify展开合作,通过这一功能将播客翻译为其他语言,同时保留播客主持人的声音。

⚫ 安全方面,OpenAI的目标是构建既安全又有益的AGI。ChatGPT逐步推出功能,可以让OpenAI有时间改进,逐步完善安全漏洞、风险。尤其是新的语音技术可在几秒内生成真实的合成声音,可能会为诈骗者提供便利条件,所以安全研发策略对于涉及语音和视觉的高级模型至关重要。

ChatGPT流量呈现回升趋势。

SimilarWeb数据显示,9月11日当周,ChatGPT流量较前一周增长约12%。据Sensor Tower显示,8月最后两周全球ChatGPT应用程序用户每周增长超过10%,流量增长主要系学生开始返校且印度及巴西市场迎来增长所致。

“大模型+小模型+应用&内容”的研究框架,我们认为多模态大模型是未来发展趋势:

Meta最近推出AudioCraft,通过AI生成音乐;谷歌Bard及必应机器人均已部署多模式功能;苹果也在试验AI生成语音Personal Voice。我们认为:1)多模态可拓展应用范围,随着大模型功能的逐渐完善,大模型的应用场景与生态也有望进一步丰富,为垂类领域应用带来更多的可能性;2)多模态将推高算力需求,图片、音频等非结构化数据可以提供更丰富的维度,扩大模型参数规模,有助于模型的持续训练和提升,算力需求有望进一步释放。长期看,AI算力的需求天花板远未达到。目前AIGC行情已有所分化,未来主题性机会有望逐步切换向案例兑现、甚至基本面兑现,龙头及龙头板块需重点关注,持续推荐具备基本面优势的【游戏】板块。

基于我们“大模型+小模型+应用及内容”的研究框架

我们认为从基本面受益的角度上看,需沿着目前成熟大模型模态输出的范围选择标的,重点关注AI+文本/虚拟人板块,其次关注AI+图片(大模型+小模型);从价值重估的角度上看,需沿着掌握优质数据或内容(多模态数据)的范围选择标的,重点关注AI+内容/IP/版权板块。

投资策略及建议:

1、建议关注AI+游戏,如【盛天网络】、【姚记科技】、【神州泰岳】、【三七互娱】、【完美世界】、【吉比特】、【世纪华通】、【巨人网络】;建议关注AI+出版,推荐【皖新传媒】、关注【中文传媒】、【中国科传】、【中国出版】等。

2、建议关注行业垂类大模型,如【创业黑马】、【昆仑万维】

3、推荐中国版Discord【创梦天地】。

4、建议关注【汇纳科技】、【引力传媒】、【浙文互联】、【世纪恒通】

参考资料: 上海证券《ChatGPT 迎看、听、说重磅升级,多模态大模型渐成趋势——互联网传媒行业周报》

市场有风险,投资需谨慎。本文仅为投资者教育使用,不构成任何投资建议,投资者据此操作,风险自担。力求本文所涉信息准确可靠,但并不对其准确性、完整性和及时性做出任何保证,对投资者据此进行投资所造成的一切损失不承担任何责任。

免责声明

本文由汇正财经的投资顾问:顾晨浩(登记编号:A0070620080002)进行编辑,仅供参考,请自主决策,风险自担。投资有风险,入市需谨慎!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1