生成式AI
一、 高通发布全新AI PC芯片骁龙X Plus 8,性能暴涨超61%
1. 高通发布新AI PC芯片骁龙X Plus 8,专为Windows操作系统设计,具有8核Oryon CPU,提供61%的性能提升和179%的能效优势;
2. 骁龙X Plus 8集成GPU支持三台外接显示器,核心NPU性能达45 TOPS,强化图形性能和连接能力;
3. 高通的多元化战略扩展到PC市场,与英特尔和AMD竞争,推动AI和PC的融合,预计将推出全系列产品,包括迷你台式电脑.
https://mp.weixin.qq.com/s/RS2DcBvjzuCwepMzZ0kudg
二、 Ilya新公司融资10亿美元!估值50亿美元,团队仅10人
1. SSI公司由Ilya创立,短短三个月内完成了10亿美元融资,估值达到50亿美元;
2. SSI计划使用这笔资金购买算力和招募顶尖人才,特别注重候选人的品格而非仅仅是资历和经验;
3. SSI的核心目标是构建安全的超级智能,与OpenAI的发展策略明显不同,强调在安全和能力上同时取得突破。
https://mp.weixin.qq.com/s/oZ00nOCRHlcJBLfMEXC3OA
三、 智谱获新一轮数十亿元融资,投前估值200亿元,国资再入局
1. 智谱完成数十亿元新一轮融资,投前估值达200亿元,主要投资者包括国资背景的中关村科学城公司;
2. 智谱在商业化方面表现突出,B端业务涵盖API、云端及本地私有化服务,C端则尝试订阅付费模式;
3. 智谱推动多模态技术和产品的快速迭代,包括视频生成模型和升级版语言大模型,同时建立投资生态以强化产业链合作。
https://mp.weixin.qq.com/s/KgU76Yl8sKt3SwqBAq_bVQ
四、 杀手级应用!Claude 企业版原生集成 GitHub,并将开放给个人
1. Claude 企业版原生集成了GitHub,提高企业用户的代码管理和协作效率;
2. 企业版特点包括增强的安全性、500K上下文窗口和更大的使用容量;
3. Anthropic计划将Claude企业版晚些时候开放给更广泛的用户群体,包括个人用户。
https://mp.weixin.qq.com/s/MJegEhJdx7V_8fEsHbjPOA
五、 架构切换,3天把Llama训成Mamba,性能不降,推理更快!
1. 研究人员将大型Transformer模型Llama转化为Mamba模型,并应用新的带硬件感知的推测解码算法,显著提升推理速度;
2. 利用渐进式蒸馏、监督微调和定向偏好优化等技术,成功在不降低性能的前提下完成模型转换;
3. 新算法允许Mamba模型在长序列中保持固定的推理开销,优化了推理效率和速度。
https://mp.weixin.qq.com/s/P_081wed8rp61_eSk_1AxQ
六、 首个100%开源的MoE大模型,7B规模对标1B推理成本
1. OLMoE是首个100%开源的MoE大模型,具有7B参数,实现了与1B参数密集模型相似的推理成本;
2. 通过使用稀疏激活技术,每个输入仅激活部分参数,提高了模型效率和训练速度;
3. 结合细粒度路由和粒度专家优化,实现了高性能,特别是在常见基准测试中表现出色。
https://mp.weixin.qq.com/s/FvsYm5HxH4f9Km4Aqrso_Q
前沿科技
七、 去太空训练大模型,24小时太阳能供电的GPU,明年上天
1. Lumen Orbit计划利用太空环境优势,如全天候太阳能供电和被动冷却,建立AI算力集群;
2. 该公司预计2025年发射首颗搭载高速GPU的演示卫星,并计划每年进行迭代发射;
3. 太空数据中心提供低边际能源成本和有效散热,有助于支持未来大规模AI模型训练。
https://mp.weixin.qq.com/s/BmYoAhtD6K1S1GfbxkB4hQ
报告观点
八、 2024腾讯全球数字生态大会汤道生:腾讯在坚持做“离产业最近的AI”
1. 腾讯云通过自研和集成推动业务增长,服务超200万家客户,国际业务增速保持两位数;
2. 汤道生强调AI在现有业务场景中的应用重要性,如通过AI提高经营效率,而非期待短期巨变;
3. 腾讯云已在700多个业务场景中落地混元大模型,推动数字技术在多行业中的应用和增长。
https://mp.weixin.qq.com/s/iRQ4KHI_86BSHzgCEvcgTA
九、 Foundry创始人:GPU利用率现状和未来,闲置节点使用新方法
1. Foundry创始人Jared Quincy Davis探讨了当前GPU云计算的低利用率问题,提出通过Spot GPU使用和创新的监控与弹性工具来提高利用率;
2. 提出了复合AI系统的概念,这种系统结合多个模型和方法,可以在不依赖大规模互联集群的情况下实现高性能;
3. Foundry致力于使先进的AI计算资源更加可访问和具成本效益,尤其是通过改善AI工作负载的云经济学。
https://mp.weixin.qq.com/s/4HRuHUuKmMg4qRNDZCmP4A
十、 2024 Inclusion·外滩大会凯文·凯利最新演讲:AI时代的三大预测
1. 全球主义推动技术统一,形成全球性的超级计算系统,促进全球文化统一和实时交流;
2. AI技术加速创新,提高学习效率和问题解决速度,改变教育和工作模式;
3. AI驱动生成新事物,推动多样化智能发展,改变人类工作和创造方式。
https://mp.weixin.qq.com/s/MvxuVxGwaZMp-1s7Bywi_A
👇订阅下方合集,获取每日推送