一键部署 LLM 混合精度推理,端到端吞吐比 AWQ 最大提升 6 倍! 清华大学计算机系 PACMAN 实验室发布开源混合精度推理系统——MixQ。...【查看原文】
随着大语言模型(Large Language Models)的爆火,例如 ChatGPT,GPT-4,PaLM,LLaMA 等,如何让大语言模型更好的应对有很长的上下文信息(超出其最大处理长度)的场景
清华大语言模型LLaMAChatGPTGPT-4
机器之心 2023-06-29
随着 ChatGPT 的出现,大规模语言模型(LLM)研究及其应用得到学术界和工业界的广泛关注。一方面,开源的 LLM 模型不断涌现,比如 OPT、BLOOM、LLaMA 等,这些预训练模型的推出极大
清华ChatGPTLLaMA
机器之心 2023-06-05
机器之心发布作者:宁雪妃、周紫轩(无问芯穹TechView)近年来,大语言模型(LargeLanguageModels,LLMs)受到学术界和工业界的广泛关注,得益于其在各种语言生成任务上的出色表现,大语言模型推动了各种人工智能应用(例如ChatGPT、Copilot等)的发展。
清华大语言模型人工智能ChatGPTCopilot
机器之心Pro 2024-06-14
写在前面 本人也只是一个计算机小白,写这篇文章的目的主要是记录自己折腾的过程。若是这篇文章能帮助到其他人部署的话我会非常开心。关于ChatGLM-6B ChatGLM-6B是一个基于GLM-130B模型的人工智能助手,通过GLM模型对语言进行处理,从而生成相应的回复。项目的主要特点是智能化回复和语言理解能力,能够对用户提出的问题和输入的文本内容进行理解和回答,可以理解为本地部署版的,资料更少的ChatGPT。关于显卡 首先,确定一下我们是什么显卡。AMD显卡很难使用,我没有AMD显卡,所以我也不知道要如何
清华人工智能ChatGLMChatGPT
早夜初雪 2023-05-30
AI大模型得到了前所未有的关注度与蓬勃发展,并在各类应用场景中产生了深远的影响。与之相应的是,对于高效、高可用的AI大模型推理系统的需求逐渐增长,成为许多企业的业务效率和成本挑战。潞晨科技公司为此打造了高效易用的Colossal-Inference推理引擎,可显著提高AI大模型吞吐速度,以应对推理场景中的性能瓶颈和成本挑战。该推理引擎集成了分块显存管理与分页注意力算法,预设与自定义模型优化策略,连续批处理调度。预设中提供高性能手写算子, 第三方的算子加速库;而在预设之外,用户可以通过使用基础算子与模型层,
AI大模型
潞晨科技官方账号 2024-05-22
金融界2024年10月22日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“一种北斗通信系统中入站传输控制方法、系统及相关装置”的专利,公开号CN118764069A,申请日期为2021年7月。专利摘要显示,本申请涉及卫星通信领域,公开了一种北斗通信系统中入站传输控制方法、系统及相关装置。
金融界 23小时前
金融界2024年10月22日消息,国家知识产权局信息显示,中国通信建设集团设计院有限公司申请一项名为“基于AI的智能光纤配线系统”的专利,公开号CN118764079A,申请日期为2024年7月。专利摘要显示,本发明提供了基于AI的智能光纤配线系统,涉及光纤通信管理技术领域。
金融界2024年10月22日消息,国家知识产权局信息显示,江西万年芯微电子有限公司取得一项名为“一种PCB增腔结构"的专利,授权公告号CN221829295U,申请日期为2024年1月。”
金融界2024年10月22日消息,国家知识产权局信息显示,华电鑫海机电设备(北京)有限公司取得一项名为“一种具有扩容功能的PLC控制柜”的专利,授权公告号CN221829297U,申请日期为2024年2月。
金融界2024年10月22日消息,国家知识产权局信息显示,西安星源博锐新能源技术有限公司取得一项名为“功率分配单元和充电设备”的专利,授权公告号CN221829302U,申请日期为2024年9月。
金融界2024年10月22日消息,国家知识产权局信息显示,河北羿珩科技有限责任公司取得一项名为“一种层压机涡流管风冷降温系统”的专利,授权公告号CN221829306U,申请日期为2023年9月。
金融界2024年10月22日消息,国家知识产权局信息显示,航天东方红卫星有限公司申请一项名为“一种基于多级总线互联的星载计算机通信方法”的专利,公开号CN118764070A,申请日期为2024年6月。
设备有限公司取得一项名为“一种机房多功能安全机架”的专利,授权公告号CN221829301U,申请日期为2024年4月。
从东方电气集团东方电机有限公司获悉,由东方电机自主研制的全球单机容量最大功率500兆瓦冲击式水电机组配水环管当日成功交付。该配水环管本体长约28米,宽约25.2米,高约4米,单个管节最大外径约3.9米,重411吨,打压试验最大压力为12.9兆帕,将应用于大唐扎拉水电站。
金融界2024年10月22日消息,国家知识产权局信息显示,佛山市顺德区宝度电子有限公司取得一项名为“一种防触电线路板”的专利,授权公告号CN221829296U,申请日期为2024年1月。
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1