在多模态深度学习发展前期总结当前多模态深度学习,发现在不同多模态组合和学习目标下,多模态深度学习实战过程中的共同问题,并对共有问题进行分类,叙述解决各类问题的方法。
具体来说,从涉及自然语言、视觉、听觉的多模态学习中考虑了语言翻译、事件探测、信息描述、情绪识别、声音识别和合成以及多媒体检索等方面研究,
将多模态深度学习实现过程中的共有问题分为模态表示、模态传译、模态融合和模态对齐四类,并对各类问题进行子分类和论述,同时列举了为解决各类问题产生的神经网络模型。
这里搜集了一份今年最新的资源,《多模态深度学习2023最新综述》PDF
白嫖上图资源+60G入门到进阶精选资源
更有:博士就业指导、论文指导、简历指导、竞赛指导、技术问题解答!
关注公众H:咕泡AI 回复211 获取
1、超详细的人工智能学习路线(AI大神博士推荐的学习地图)
2、人工智能必看书籍(动手学习深度学习、花书、西瓜书、蜥蜴书AI宝藏电子书这里都有)
3、60份人工智能行业报告(想了解人工智能行业前景就看这!)
4、人工智能快速入门视频教程合集(Python基础、数学基础、机器学习算法与实战、NLP、数据分析等等)
5、上千篇CVPR、ICCV顶会论文
6、唐宇迪博士精心整理的人工智能学习大纲
7、机器学习算法+深度学习神经网络基础教程
8、OpenCV、Pytorch、YOLO等主流框架算法实战教程