生成式AI
一、 云上的生成式AI,微软Azure首席技术官Mark分享AI创新
1. 微软Azure首席技术官Mark在斯坦福大学的演讲中全面介绍了微软Azure如何实现生成式AI模型训练推理的优化和创新;
2. 强调了与OpenAI等公司的合作伙伴关系,以及微软在AI硬件和服务提供方面的创新,包括Project Forge资源管理器的开发和多LoRa微调服务;
3. 讨论了微小模型的可能性,通过高质量数据推理的研究,以及对未来AI发展方向的探索,包括机密AI的重要性。
https://mp.weixin.qq.com/s/Imt4Fl6Wbrik2F037WE8hQ
二、 重磅!马斯克宣布开源AI大模型Grok,继续硬刚OpenAI
1. 马斯克宣布将在本周内开源xAI旗下的AI助手Grok,继续与OpenAI的竞争;
2. 新版本Grok V1.5可能包含“Grok 分析”按钮等功能,旨在提高用户理解复杂对话和内容创作的效率;
3. Grok模型特点为轻量,使用Rust等技术优化计算效率,在与OpenAI的法律诉讼背景下选择开源或许是吸引更多开发者和用户的策略。
https://mp.weixin.qq.com/s/1pduUDEiI0SnFHAQMnP2QA
三、 一款没有App的手机,T-Phone 会不会是未来 AI 手机的雏形?
1. T-Phone是一款无需传统App的概念手机,旨在通过AI助手使用上下文预测生成用户界面,从而完成各项任务;
2. 尽管标榜为“无App”手机,T-Phone实质上依赖现有App生态,并通过云和本地AI处理结合,提高任务执行效率和减少功耗;
3. T-Phone反映了一种技术趋势,即通过AI使用户成为技术的中心,未来可能不再需要传统App,但当前仍处于早期阶段,与传统智能手机共存。
https://mp.weixin.qq.com/s/IvRG_dBZ1BhiR3FR8Dy_mg
四、 零一万物自研全导航图向量数据库,横扫权威榜单6项第一
1. 零一万物推出的向量数据库「笛卡尔」在ANN-Benchmarks榜单上获得六项数据集评测第一名,显示显著的性能提升;
2. 向量数据库作为AI时代的重要基础设施,对大模型性能表现有着重要影响,笛卡尔通过全导航图技术和自适应邻居选择策略实现优化;
3. 笛卡尔向量数据库将应用于即将发布的AI产品中,凭借其高精度和高性能,为大模型的应用开发提供有效支持,同时展望在未来大模型优化中的关键作用。
https://mp.weixin.qq.com/s/FAH1nPYLKtkiniW3WcYRxg
五、 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
1. 加州大学伯克利和斯坦福大学等联合研究提出了一个程序框架"RULES",用于评估语言大模型遵循规则的能力;
2. "RULES"测试通过分为14个场景,评估模型在遵循一系列无害规则和有用规则的能力,以检查其生成内容的合规性;
3. 尽管GPT-4在评估中表现最佳,但未能通过所有测试用例,显示即便是先进的大模型也难以完全遵守人类设定的规则,反映了大模型在理解和遵守复杂规则方面的限制。
https://mp.weixin.qq.com/s/6nWf5O6L6zlnT9xfl0fakA
六、 AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖
1. AI的应用在数学领域取得重大进展,发现椭圆曲线中的murmuration现象,为深入理解椭圆曲线提供了新的视角;
2. 此次发现源于多重偶然,包括数据的特定排序和本科生的非传统处理方法,展示了研究过程中的不确定性和创新的重要性;
3. 该发现引发了数学界的广泛关注和后续研究,包括对椭圆曲线和更广泛的L函数的进一步探索,证明了AI在解决复杂数学问题中的潜力。
https://mp.weixin.qq.com/s/t6Nr5aYlu1hKJN1yLHGLBw
七、 清华发布InfLLM:无需额外训练,1024K超长上下文100%召回!
1. InfLLM由清华大学等机构提出,不需额外训练,通过外部记忆模块扩展大模型上下文长度,实现超长文本理解;
2. 创新地将历史上下文分为语义块,以减少噪声干扰和查询复杂度,提高长文本处理效率;
3. 在1024K超长文本上实现了100%召回,证明了其在处理超长上下文信息中的高效性和准确性。
https://mp.weixin.qq.com/s/6H9hvYrxCYVuW_g1F8EXCg
前沿科技
八、 用Vision Pro实时训练机器狗!MIT博士生开源项目火了
1. MIT博士生Younghyo Park开发了一个利用Vision Pro手部追踪功能实时控制机器狗的应用,成功实现精准动作控制;
2. 该项目已在GitHub开源,通过Vision Pro的App Store可下载相关App,使用ARKit库和gRPC协议进行动作追踪和数据流式传输;
3. 结合模仿学习算法,Vision Pro提供直观的交互方式,让非专业人士也能为机器人提供训练数据,预示着未来与机器互动的新方式。
https://mp.weixin.qq.com/s/Zq7xxhJk14hFQ_OSTZre1g
报告观点
九、 黄仁勋:考虑到TCO,即使竞争对手AI芯片免费也拿英伟达GPU没办法
1. 黄仁勋认为英伟达GPU的性价比高到连免费的竞争对手芯片也难以匹敌,强调总拥有成本(TCO)优势;
2. 尽管面对广泛的竞争,英伟达维持开放合作的姿态,即使是与正在设计替代AI处理器的客户;
3. 英伟达面临来自Groq和AMD前高管的指控,被称为控制GPU供应的“卡特尔”,但其在AI开发领域的主导地位仍难以撼动。
https://mp.weixin.qq.com/s/-_R4cxsmjSKTfdvWkN0U0Q
十、 荷兰数字经济学家论文:ChatGPT年电费2亿?!日耗电量≈1.7万个家庭
1. ChatGPT的日耗电量相当于1.7万个美国家庭,年电费高达2亿美元,表明其运营对能源的巨大需求;
2. 尽管ChatGPT的能耗巨大,但其为全球服务的价值和效率,相比之下,能耗被视为相对合理;
3. 面对AI技术对能源的巨大需求,未来的能源技术突破,如可控核聚变或更便宜的太阳能及存储,将是关键。
https://mp.weixin.qq.com/s/D5DR1jWBuOHphwFNiGGixQ
https://docs.qq.com/sheet/DYXVhemNFem1XZ2ZC?tab=BB08J2