当前位置:首页|资讯|GPT-4|Claude

比标准Attention提速5-9倍,大模型都在用的FlashAttention v2来了

作者:机器之心发布时间:2023-07-31

近来,几种长上下文语言模型陆续问世,包括 GPT-4(上下文长度为 32k)、MosaicML 的 MPT(上下文长度为 65k)Anthropic 的 Claude(上下文长度为 100k)。长文档...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1