生成式AI
一、 全球最强开源模型一夜易主,1320亿参数推理飙升2倍!
1. Databricks发布的DBRX成为全球最强开源大模型,使用细粒度MoE架构和1320亿参数,每次仅激活360亿参数,提升推理速度至2倍;
2. 训练成本大幅降低,仅需1000万美元和3100块H100,在2个月内完成,相较于Llama2大幅节省成本和资源;
3. DBRX在多项性能指标上超越现有模型,即使在与GPT-3.5的比较中也有优势,并向开放社区和企业提供API功能。
https://mp.weixin.qq.com/s/88zvF3vwtTJcGl__HR6hBg
二、 亚马逊追投Anthropic 27.5亿刀,市值暴涨5000亿!
1. 亚马逊对Anthropic追加27.5亿美元投资,总投资达40亿美元,成为亚马逊历史上单笔最大的外部投资;
2. Anthropic的Claude 3模型有望超过GPT-4成为性能最强的大模型,带动亚马逊股价近50%上涨,创历史新高;
3. 引起监管关注,FTC已开始调查微软对OpenAI投资的反垄断问题,指出大模型公司与云服务强强联合可能扭曲创新和公平竞争。
https://mp.weixin.qq.com/s/jb7rrJ441VD39wo7ulO15A
三、 谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
1. 谷歌与南加州大学开发的“SELF-DISCOVER”框架,能让大语言模型自行发现和解决复杂推理问题;
2. 在多个复杂推理测试中,该框架带来了高达42%的性能提升,显著优于传统的链式思维方法;
3. SELF-DISCOVER通过整合多个推理模块、提高效率、并反映任务内在特性,特别在需要世界知识的任务上表现出色。
https://mp.weixin.qq.com/s/m-OrizxWnxMgh1Cw5ataPA
四、 微软亚研院的新作:让大模型可以一口气调用数百万个API!
1. 微软亚研院推出TaskMatrix.AI,连接大模型与数百万API,以完成多样化任务;
2. TaskMatrix.AI架构包含多模态对话基础模型、API平台、API选择器和API执行器,实现高效任务处理;
3. 通过人类反馈的强化学习和向API开发者提供反馈,TaskMatrix.AI具备终身学习能力和高度可解释性。
https://mp.weixin.qq.com/s/fy9lw3QwOMryFMOEmTXfUA
五、 HeyGen新功能Avatar in Motion,惊艳复刻动作、表情与声音
1. HeyGen推出的Avatar in Motion 1.0技术能精准捕捉动作、面部表情和声音,为数字创新领域带来突破;
2. 技术应用广泛,从游戏、电影制作到在线教育和虚拟会议,但也引发关于隐私和网络安全的担忧;
3. 尽管存在潜在滥用风险,技术为自媒体创作者提供全新平台,需审慎对待技术发展,保障安全和隐私。
https://mp.weixin.qq.com/s/sMlqnSIQFA1qNOI0dy52VA
六、 看视频、画CAD、运动想像识别!75B的多模态工业大模型发布
1. 创新奇智推出奇智孔明工业大模型2.0版本(AInno-75B),提升了模型规模和多模态能力,能处理文本、图片、视频等多种信息模态;
2. ChatCAD应用通过对话生成符合要求的CAD设计图,ChatVision应用可以实时分析监控视频流和图片,识别不合规行为;
3. ChatRobot Pro利用非侵入式脑电信号识别用户的运动想像,指挥工业机器人完成任务,显示了工业大模型在多模态领域的应用潜力。
https://mp.weixin.qq.com/s/MA6I4rh5yWRYom3H6b0Q_Q
七、 元象大模型开源30款量化版本可商用,加速低成本部署丨附教程
1. 元象大模型开源30款量化版本,无条件免费商用,目的是为中小企业和开发者提供低成本的部署方案;
2. 模型量化通过优化内存占用和降低访存开销,实现在推理性能和模型能力间的极致平衡,例如XVERSE-13B-GPTQ-Int4量化版本在保留95%能力的同时,模型权重压缩72%,总吞吐提高1.5倍;
3. 提供了vLLM和llama.cpp等主流框架支持的量化推理方案,使得开发者可以根据需求选择不同推理框架和数据精度的模型,简化开发部署流程。
https://mp.weixin.qq.com/s/XfrPTogrys6EWbt__Ipzag
前沿科技
八、 Earth-2地球数字孪生平台,英伟达的的疯狂新项目!可以精确预测未来
1. Earth-2是英伟达推出的基于云的地球数字孪生平台,旨在通过精确模拟气候变化来应对全球变暖;
2. 该平台利用高性能计算基础设施和Omniverse Cloud APIs实现高清可视化,提高预测极端天气条件的准确性,并可快速提供实时天气预报和预警;
3. Earth-2将为The Weather Company等组织提供开发包含连续环境数据的3D工作流程的能力,从而深入分析和模拟气象影响,助力响应自然灾害。
https://mp.weixin.qq.com/s/90J4rxtrFi5tfrTOul3izg
九、 比发现“上帝粒子”罕见50倍!北大Nature新成果,首次观测到三玻色子联合产生
1. 北京大学物理系研究团队在Nature上发表了新成果,首次观测到双W玻色子与光子(WWγ)的三玻色子联合产生过程;
2. 这一发现在数十亿次质子-质子对撞中仅250次成功,证实其罕见性,验证了粒子物理的标准模型;
3. 该成果是高能对撞机物理领域的前沿热点,为探测非阿贝尔相互作用及检验标准模型提供了新的实验依据。
https://mp.weixin.qq.com/s/hjnbSEZY1vPIQU9NydUqgg
报告观点
十、 美国白宫OSTP发布《国家微电子研究战略》,五年目标、关键需求和行动方案
1. 发布《国家微电子研究战略》旨在确保美国微电子领域全球领先,概述了发展目标、关键需求和行动方案;
2. 策略包括促进微电子技术研究,建设基础设施,培养技术劳动力,创建创新生态系统;
3. 关注新材料、电路设计工具、新架构硬件设计、先进封装和异构集成技术,以及硬件安全性。
https://mp.weixin.qq.com/s/jfqmVaohSt2XkCwgNeT_yQ
点击下方#腾讯研究院AI速递合集 查看往期内容