本期为TechBeat人工智能社区第515期线上Talk!
北京时间7月20日(周四)20:00,北京航空航天大学硕士研究生—王泽坤的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “在LLM之上还能创造哪些价值?百页综述梳理后 ChatGPT 技术链”,届时将分享当下大模型的研究焦点,即如何建立更全面的框架,以改善大模型与人、与知识库、与模型、与工具和与环境的交互,并提出了“交互式自然语言处理”。
主题:在LLM之上还能创造哪些价值?百页综述梳理后 ChatGPT 技术链
嘉宾:北京航空航天大学硕士研究生 王泽坤
时间:北京时间 7月20日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
长按识别二维码,一键预约TALK!
ChatGPT 对 NLP 产生了翻天覆地的影响,一时间,人们开始相信“NLP已经被解决”。然而,在大模型的实际应用中我们发现,大模型仍然具有一些难以克服的问题,如对齐、幻觉、长文本处理等。在这篇综述中,我们系统梳理了当下围绕着大模型的研究焦点,即如何建立更全面的框架,以改善大模型与人、与知识库、与模型、与工具和与环境的交互,并提出了“交互式自然语言处理”。一方面,通过大模型与外部实体的交互,可以缓解大模型自身的一些固有问题并扩展大模型的功能与特性;另一方面,通过将大模型视作广义环境中的智能体,交互特性是大模型通往通用人工智能的一把钥匙。
1、背景和动机
2、相关工作
3、从交互对象的维度
(1)大模型与人交互
(2) 大模型与知识库交互
(3)大模型与模型、工具交互
(4)大模型与环境交互
4、从交互媒介的维度
(1)通过自然语言交互
(2)通过形式语言交互
(3) 通过编辑语言交互
(4)通过机器语言交互
(5)通过共享记忆交互
5、从交互方法的维度
(1)提示技术:上下文学习 (In-Context Learning)、思维链、提示级联等。
(2)微调技术:指令学习、持续学习、半监督学习、参数高效学习等。
(3)其他方法:主动学习、强化学习、模仿学习、交互信息融合等。
6、对交互的评测
7、交互特性的应用
8、伦理与安全
9、未来发展方向和挑战
论文链接:
https://arxiv.org/abs/2305.13246
机器之心推文:
https://mp.weixin.qq.com/s/qNKM_xyYJigSGtE4J3UXXQ
Paper list:
https://github.com/InteractiveNLP-Team/awesome-InteractiveNLP-papers
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
王泽坤,北京航空航天大学一年级在读硕士生,师从许可教授。研究方向为自然语言处理与多模态。他的主要研究兴趣为多模态基础模型、思维链 (Chain of Thought) 、检索增强以及 Alignment 等。同时也在探索大型语言模型作为 agent 的技术链,比如工具使用、社会模拟、具身智能等。他曾在澜舟科技、北京智源人工智能研究院等进行科研实习。
个人主页:
https://www.techbeat.net/grzytrkj?id=18749
长按识别二维码,一键预约TALK!
关于TechBeat人工智能社区
TechBeat (www.techbeat.net) 是一个荟聚全球华人AI精英的成长社区。 我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。 期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
泰普洛 2024-12-20
泰普洛 2024-12-20
凌零网创 2024-12-20
源码哥_博纳软云 2024-12-20