先进理念·技术前沿
全彩印刷·资源完备
《多模态深度学习技术基础》
ISBN:9787302637479
作者:冯方向,王小捷 主编
多模态信息处理
单模态深度学习表示技术
多模态深度学习基础技术
多模态预训练技术
配套资源:教学大纲,教学课件,习题答案
内容简介 / 架构
深度学习技术的引入使得多模态信息处理领域取得了巨大的突破。本书在介绍多模态信息处理的基础概念和典型任务的基础上,重点介绍最通用、最基础的基于深度学习的多模态信息处理技术,覆盖了多模态表示、对齐、融合和转换四大基础技术,同时也介绍了多模态信息处理领域的最新发展前沿技术——多模态预训练技术。
本书分为四大部分:第一部分为初识多模态信息处理, 介绍多模态信息的基本概念、难点、使用深度学习方法的动机、多模态信息处理的基础技术的发展历史以及若干热门多模态研究任务;第二部分为单模态深度学习表示技术,介绍了多模态深度学习模型中常用的文本表示和图像表示技术;第三部分为多模态深度学习基础技术,介绍面向特定任务的基于深度学习的多模态表示、对齐、融合和转换这四个技术;第四部分为多模态预训练技术,介绍综合使用四个基础技术,并以学习通用多模态表示或同时完成多个多模态任务为目标的多模态深度学习技术。
本书可以作为多模态信息处理、多模态深度学习等相关课程的教学参考书,适用于高等院校智能科学与技术和人工智能等专业的本科生、研究生,同时可供对多模态深度学习技术感兴趣的工程师和研究人员参考。
本
书
特
色
1、全新设计的多模态深度学习教材,内容全面,结构合理,填补教材空白。
2、提供4个完整实战案例,对应多模态表示、对齐、融合和转换技术,并提供Jupyter Notebook文件。
3、可作为高等学校人工智能及相关专业的多模态深度学习教材,也可作为教辅资料和参考书。
4、配套资源完备,方便教师教学和学生学习。
全书目录
向上滑动阅览
第1章 绪论
第2章 多模态任务
第3章 文本表示
第4章 图像表示
第5章 多模态表示
第6章 多模态对齐
第7章 多模态融合
第8章 多模态转换
第9章 多模态预训练
参考文献
作者简介
冯方向
北京邮电大学人工智能学院助理教授
主要研究方向多模态认知计算,发表学术论文30余篇,主持和参与多项国家级科研项目。发表学术论文30余篇,曾获ACM Multimedia最佳论文提名,单篇引用超过500次,2022-2023年连续入选Aminer人工智能全球最具影响力学者提名。主讲本科生课程“神经网络与深度学习”“多模态信息处理”。主持和参与多项省部级教学项目。
王小捷
北京邮电大学人工智能学院教授,智能科学与技术中心主任
教育部信息网络工程研究中心副主任,中国人工智能学会自然语言理解专委会主任、教育工作委员会副主任,自然语言处理领域首席专家。主要研究方向为自然语言处理与多模态计算,主持和参与国家级科研项目20余项,发表学术论文200余篇,曾获中国发明协会科技发明成果一等奖,2021-2023年连续入选Aminer人工智能全球最具影响力学者提名。
精彩样章
向上滑动阅览
资源展示
教学大纲
全套教学ppt