现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑...【查看原文】
十年前,移动互联网充满朝气,每天都有新芽从智能手机的沃土中长出。十年后,我们早已习惯了Web2.0社
ChatGPT
appso 2023-01-15
一年时间,斯坦福大学提出的新型 Attention 算法 ——FlashAttention 完成了进化。这次在算法、并行化和工作分区等方面都有了显著改进,对大模型的适用性也更强了。近来,几种长上下文语言模型陆续问世,包括 GPT-4(上下文长度为 32k)、MosaicML 的 MPT(上下文长度为 65k)Anthropic 的 Claude(上下文长度为 100k)。长文档查询和故事写作等新兴用例已经表明扩展语言模型上下文窗口是非常必要的。然而,扩大 Transformer 的上下文长度是一
斯坦福GPT-4Claude
AI研习所 2023-07-25
这一模型比GPT-4、GeminiUltra、ClaudeOpus等模型能力更强,更引人注目的是,其训练成本只需要500美元。
斯坦福GPT-4
21世纪经济报道 2024-06-14
说回我们在AI领域贡献的开源大模型技术,从此次事件来看,中国的开源模型其实十分强大,但在国际社区中的整体知名度并不高。还有一位国外AI社区的创始人也说道:“中国在机器学习生态的工作一直以来都被社区忽视了。也有…
通义千问斯坦福清华
OSC开源社区 2024-06-18
一般来说,便当盒有隔区,这放肉食,那放米饭,Bento也是如此,他们借用了「便当理论」,在填写待办事项之前,就要求用户先把任务拆分成「小/中/大」三种类型,他们对这三种类型任务也有自己的定义。VALL-E可以…
AppSo 2023-01-26
金融界2024年12月28日消息,国家知识产权局信息显示,泰科天润半导体科技(北京)有限公司取得一项名为“一种低阻平面栅碳化硅MOSFET”的专利,授权公告号CN222214181U,申请日期为2024年3月。
金融界 2024-12-28
金融界2024年12月28日消息,国家知识产权局信息显示,武汉帝尔激光科技股份有限公司取得一项名为“一种无主栅太阳能电池片激光诱导烧结装置”的专利,授权公告号CN222214195U,申请日期为2024年1月。
金融界2024年12月28日消息,国家知识产权局信息显示,常州时创能源股份有限公司取得一项名为“一种背接触叠栅结构电池片及电池”的专利,授权公告号CN222214187U,申请日期为2024年1月。
金融界2024年12月28日消息,国家知识产权局信息显示,南通晶天新能源科技有限公司取得一项名为“一种微结构棱镜间隙转光膜”的专利,授权公告号CN222214190U,申请日期为2024年4月。
金融界2024年12月28日消息,国家知识产权局信息显示,江西兆驰半导体有限公司取得一项名为“一种发光二极管芯片”的专利,授权公告号CN222214202U,申请日期为2024年11月。
金融界2024年12月28日消息,国家知识产权局信息显示,阜宁协鑫集成科技有限公司取得一项名为“一种返修电池串弧预防与整理装置”的专利,授权公告号CN222214198U,申请日期为2024年5月。专利摘要显示,本实用新型涉及光伏组件生产技术领域,且公开了一种返修电池串弧预防与整理装置。
金融界2024年12月28日消息,国家知识产权局信息显示,成都格林纳光科技有限公司取得一项名为“一种半导体量子点发光二极管封装结构”的专利,授权公告号CN222214204U,申请日期为2024年3月。
金融界2024年12月28日消息,国家知识产权局信息显示,固德威电源科技(广德)有限公司取得一项名为“一种轻质光伏系统”的专利,授权公告号CN222214189U,申请日期为2023年12月。
金融界2024年12月28日消息,国家知识产权局信息显示,深圳市大合半导体科技有限公司取得一项名为“一种荧光胶量可控型LED灯封装结构”的专利,授权公告号CN222214201U,申请日期为2024年5月。专利摘要显示,本实用新型公开了一种荧光胶量可控型LED灯封装结构,包括调节模块、LED基板、操作台、固定模块。
金融界2024年12月28日消息,国家知识产权局信息显示,安徽吕顺智能科技有限公司取得一项名为“一种光伏玻璃背板压合装置”的专利,授权公告号CN222214199U,申请日期为2024年5月。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1