当前位置：首页|资讯|ChatGPT|大语言模型|LLaMA|人工智能

直播预告| 8月31日模型压缩与高效神经网络

作者：小牛翻译NiuTrans发布时间：2023-08-28

ChatGPT 大语言模型 LLaMA 人工智能

最近，以ChatGPT为代表的大语言模型在多轮对话等任务上展现出强大的性能，大型语言模型似乎已成为通向通用人工智能的必经之路。然而，模型量级与“智能”之间的关系仍然不得而知，普遍观点认为模型越大性能越强。但是随着模型变大，模型推断所需的显存和时间也成倍增长，计算代价十分高昂。以LLaMA-7B为例，翻译一条100字左右的文本需要近7s，而使用相同的设备配置，不到1B的机器翻译模型可在1s内以相同精度翻译长达数百字的篇章。因此，在保证模型精度的前提下，探索降低计算代价的高效方法是十分必要的。那么，高效方法具体有哪些？又将如何降低模型内存占用和计算代价？

本期报告将从传统静态模型压缩方法和动态模型加速方法两个角度进行讲解，对大型语言模型相关的高效方法进行总结。报告主要包括两部分内容，第一部分为剪枝、量化等模型压缩方法，该类方法以更小的静态模型实现与大模型相似的推断性能；第二部分以早退、混合专家等条件计算方法为主，该类方法使用动态激活的方式，仅激活部分大模型以降低模型的计算代价。

本期报告将于8月31日线上举办，届时由来自东北大学自然语言处理实验室的单韦乔为我们带来《模型压缩与高效神经网络》报告，具体流程如下：

本次直播将分为两部分进行，第一部分为报告分享环节，第二部分为Q&A环节。在直播过程中，小伙伴可以把问题发送到直播间中，并在Q&A环节与本期嘉宾深入探讨；未被回复的问题也可私信留言，在直播结束后我们会进行解答。

本系列直播作为公益知识分享活动，由东北大学自然语言处理实验室、小牛翻译联合推出，感谢AI科技评论、PaperWeekly、机器之心、并行科技对本次直播的大力支持，本次直播向所有听众免费开放，无需注册和报名缴费。

参会观众可以在【视频号（ID：小牛翻译云平台）、微博（ID：小牛翻译）、哔哩哔哩（ID：小牛翻译）、知乎（ID：小牛翻译云平台）、机器翻译学堂（https://school.niutrans.com/live）】观看直播，关注【机器翻译学堂、小牛翻译云平台视频号】即可观看直播回放。

诚邀所有关注自然语言处理与大模型技术发展的朋友走进直播间，2023年8月31日（周四）18:30，我们期待与您的相遇！

推荐体验

相关资讯

神经网络与深度学习

链接：https://pan.baidu.com/s/1uAp9P5cvS4phi97PAdqUxA?pwd=yl5f 提取码：yl5f本书是深度学习领域的入门教材，系统地整理了深度学习的知识体系，并由浅入深地阐述了深度学习的原理、模型以及方法，使得读者能全面地掌握深度学习的相关知识，并提高以深度学习技术来解决实际问题的能力。全书共15章，分为三个部分。·第一部分为机器学习基础：第1章是绪论，介绍人工智能、机器学习、深度学习的概要，使读者全面了解相关知识；第2~3章介绍机器学习的基础知识。·第二部分是基础

人工智能百度深度学习机器学习

今天天气不错风也温柔 2023-04-12

深度学习与神经网络入门

随着ChatGPT的爆火以及最近各种爆发的大模型竞争，人工智能行业逐渐走入了大众的眼球。作为喜欢折腾各种技术的爱好者，自然也希望能了解一些其中的原理。但想要更好的了解AI领域的知识，我想从深度学习开始

深度学习 ChatGPT 人工智能

CareyWYR 2023-06-25

卷积神经网络在直播美颜SDK中有哪些作用？

在之前的技术话题中，小编曾经聊到了直播美颜SDK技术深度学习和机器学习方面的问题。实际上，在宏观角度来讲，深度学习只是一个框架，其中有各种各样不同的美颜算法而已，其中最重要的就是卷积神经网络，对于不同的问题和场景，需要通过不同的网络模型来解决。因此，为了让最终处理效果更好，我们需要更好的理解并运营“卷积神经网络”，下文小编将着重为大家讲解一下直播美颜sdk的关键技术——卷积神经网络。直播美颜SDK一、卷积神经网络简述直播美颜SDK对图像进行卷积操作是为了采集、提取图像的特征，所以会因此而降级维度。在深度学

人工智能深度学习

美狐美颜SDK 2023-01-04

6种卷积神经网络压缩方法、神经网络基础部件优化详解、深度学习模型的鲁棒性下降探讨 |人工智能周刊第4期

6种卷积神经网络压缩方法、神经网络基础部件优化详解、深度学习模型的鲁棒性下降探讨、DTC补货实战：从算法到落地...

人工智能深度学习

酱酱们的下午茶 2023-02-07

图神经网络：基础、前沿与应用

链接：https://pan.baidu.com/s/1ITVcV6A35WCUYXtcJ9RZ1Q?pwd=xpfq 提取码：xpfq编辑推荐适读人群：本书适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。前沿：图神经网络是机器学习、数据科学、数据挖掘领域新兴的发展方向，被称作图上的深度学习，有望推动第三代人工智能的顺利发展。丰富：综述图神经网络的基础理论、模拟算法、研究前沿以及广泛和新兴的应用场景深入：摒弃简单介绍概念与框架的思维，深入分析图神经网络的现状以及未来的调整与机遇，

百度人工智能深度学习机器学习

破产的哔站用户 2023-03-31

近期资讯

各大App用户年度总结齐上阵，个性之余是否会泄露隐私？

“循环播放次数最多的歌”“最偏爱的美食”“熬得最长的夜是哪一天”“常用什么表情当嘴替”……年终岁末，各大App的用户年度报告如约而至，这些用户年度报告全方位覆盖日常生活。

北京日报 2024-12-30

Windows深色模式历经十年仍未完善！还有大量未完成部分

快科技12月30日消息，自2016年微软为Windows10引入深色模式切换功能以来，用户一直期待系统界面能够实现全面的深色主题。WindowsCentral发文指出，尽管许多应用程序和系统界面已支持根据系统设置切换主题，但Windows自身的用户界面在深色模式方面仍存在很多问题。

驱动之家 2024-12-30

热销20万件，补贴440元！华帝i10092B，燃气灶，性价比之选

#年货节好物集市#在现代家庭中，一款高效、安全且易于维护的燃气灶不仅是烹饪美食的关键工具，更是提升生活质量的重要因素。今天，我们将详细介绍华帝旗下的明星产品——i10092B家用5.2kW大火力天然气嵌入式燃气灶，这款燃气灶不仅以其高性价比吸引了众多消费者，更以其实用性和安全性成为家庭厨房的理想选择。

小米地瓜 2024-12-30

智邦国际一体化ERP：全维布局，全员创新，构建生产制造数字化新生态

从大规模设备更新行动、实施技术改造升级工程、供应链产业链“链式”转型到构建中小企业数字化转型生态，从产业集群、城市全域到园区企业，正在全方位加速落地企业跨地域数据互通、资源共享、业务协同的虚实结合产业数字化新生态。

极目新闻 2024-12-30

揭秘！容声这款大容量冰箱，让幸福“触手可及”

12月28日，容声正式发布了606WILL养鲜新品冰箱，这款冰箱是新一代品质生活的理想之选。凭借卓越的WILL自然养鲜系统，以及超薄平嵌越级空间设计，容声606WILL养鲜冰箱为用户带来了功能体验上的全新升级。

砍柴网 2024-12-30

全汉MEGA TI电源上市：1350W功率支持ATX 3.1标准

快科技12月30日消息，全汉旗舰钛金牌电源MEGA TI目前已经上市，具有1350W功率。据悉，MEGA TI 1350W符合英特尔ATX 3.1 和 EPS 2.92 标准，拥有80 PLUS、Cybenetics双机构钛金转换效率认证。

鹿角 2024-12-30

轻松掌握手机绘画技巧，教你创作独特手机艺术作品

画手机其实并没有想象中那么复杂，只要掌握了一些基本的技巧和步骤，你就能轻松画出一部精致的手机。无论是铅笔、炭笔，还是数位板，最重要的是你要有一个舒适的环境来进行创作。可以先用铅笔轻轻地勾勒出手机的外形。

新报观察 2024-12-30

水井坊深耕技术创新，引领酒业迈向智能化时代

水井坊，作为我国高水平对外开放的成功案例，通过持续的技术创新投入和研发实践，不断推动产品升级和品牌发展，成为行业内的佼佼者。水井坊在数字化、智能化生产以及微生物研究方面的探索，，符合当前推动产业升级和技术革新的趋势。在生产环节，水井坊紧跟时代步伐，采用了智能化的生产设备和系统。

时代周报 2024-12-30

你还敢坐波音吗！韩国客机事故发生仅1日又一波音飞机故障

12月29日一架韩国济州航空客机在韩国南部全罗南道务安国际机场降落过程中冲出跑道，和机场围栏等发生碰撞后起火。除2人获救外，机上其余179人全部遇难，这是在韩国国内发生的伤亡最严重的空难

雪花 2024-12-30

奋达科技：与客户合作的陪伴类AI桌面机器人首批已出货

就“公司与客户合作的陪伴类AI桌面机器人预计12月量产交付，请问如期量产交付了吗？”的问题，奋达科技：12月30日在互动平台表示，首批已出货，后续将根据客户订单安排生产制造。

证券时报 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1