当前位置:首页|资讯|斯坦福|编程|ChatGPT

Transformer挑战者出现!斯坦福CMU联合团队,模型代码都开源

作者:量子位发布时间:2023-12-06

现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑...【查看原文】


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1