生成式AI
一、 OpenAI今天终于又Open了一下:开源多智能体框架Swarm
1. OpenAI发布了多智能体框架Swarm;为实验性质,支持轻量、高效的智能体编排和交互;
2. Swarm可处理复杂功能和指令;提供可扩展的解决方案,适合开发者精确控制上下文和步骤;
3. Swarm完全运行在客户端,依赖Chat Completions API,不存储状态,支持高自定义。
https://mp.weixin.qq.com/s/3-iKztrTuRURUGtles4-xA
二、 苹果多模态模型MM1.5!文本密集、多图理解,全能小钢炮
1. 苹果推出多模态大模型MM1.5;从1B到30B参数,涵盖文本密集和多图像理解;
2. MM1.5优化了OCR能力,支持高分辨率图像,并提升了视觉内容的解释力;
3. 通过持续预训练和监督微调,进一步增强了模型的上下文学习和多图像推理能力。
https://mp.weixin.qq.com/s/jIevs7L4zwWOWzXM4nx62A
三、 李飞飞新成果:数字表亲,一张照片生成机器人训练场景
1. 李飞飞团队提出“数字表亲”概念,不追求与真实物体一比一的复制,降低成本,增强模型泛化能力;
2. 数字表亲通过简单拍照即可创建,用于机器人训练,提供变化且相似的训练场景;
3. 通过ACDC方法自动创建数字表亲,实现从虚拟到真实的零样本迁移,表现优于数字孪生模型。
https://mp.weixin.qq.com/s/7PKeF1rp8A9iqB914j4yGw
四、 被忽略的微软 Copilot 大更新,从里面挖到了一些有趣的东西
1. 微软Copilot更新重构用户体验,其中Copilot Voice与Copilot Vision以情感智能为核心;
2. Copilot Voice支持五个国家英语用户,并将逐步扩展;Copilot Vision即将在美国限量推出;
3. 更新强调情感连接,通过视觉和语音交互提升用户体验,色彩设计趋向温暖化以增强互动。
https://mp.weixin.qq.com/s/9R3nNVqrCzam7J7yDJNllg
五、 AI短视频时代真的来了!零门槛上手,即梦AI喊话有奖创作
1. 即梦AI平台推出了“竖屏限时创作挑战”,鼓励用户使用AI工具创作10秒至60秒的竖屏短视频;
2. 平台通过激励机制,如提供创作基金,促进高质量AIGC内容的生成,扩大用户参与;
3. 竖屏短视频格式更符合当前用户的观看习惯,即梦AI借此提高内容的个性化体验和获取速度。
https://mp.weixin.qq.com/s/3_39Q757jt8x90r2bzJGdg
六、 LeanAgent破解162个高数定理,希望攻克困扰陶哲轩难题!
1. 清华校友利用AI智能体LeanAgent证明了162个未解的高等数学定理,显示AI在科学研究中的潜力;
2. LeanAgent采用终身学习策略,能够持续吸收新知识而不忘记旧知识,表现出对复杂数学问题的适应能力;
3. 尽管取得显著进展,AI在解决陶哲轩的Freiman-Ruzsa猜想等高级数学问题上仍存在限制。
https://mp.weixin.qq.com/s/KrzgEPFj9vcu3hAYKlnZAw
前沿科技
七、 八年磨一剑,星舰第五飞:SpaceX成功实现“筷子夹火箭”
1. SpaceX成功实现星舰一级火箭的发射台回收,利用Mecahzilla机械臂在第五次飞行测试中捕捉并回收火箭;
2. Elon Musk的宏伟目标是建立火星上的自给自足人类城市,推进人类成为多星球文明;
3. FAA与SpaceX就发射许可经历争议,最终在飞行前夕授予IFT-5的发射许可,且一次性批准了IFT-6的发射。
https://mp.weixin.qq.com/s/6DRMHmZ6otFGuyx3cyTXFw
报告观点
八、 Anthropic CEO:AI 将在未来 10 年左右消除所有疾病,人类寿命能到150岁
1. AI将在未来10年消除所有疾病,使人类平均寿命能够达到150岁;
2. 具体应用包括生物健康、神经科学、经济发展、和平治理等关键领域,以提升人类生活质量;
3. 强大AI的积极应用需要结合防范潜在风险的策略,以确保技术发展利益最大化。
https://mp.weixin.qq.com/s/NL8bKh97y8cADM2xnRw0WQ
九、 普林斯顿教授:构建大参数模型不再有效,数据是瓶颈;社会对AI过度恐惧
1. 增加计算资源并不总是能提升AI模型的性能,数据量成为AI发展的主要瓶颈;
2. 社会对AI的恐惧普遍过度,忽视了AI目前主要作为工具的现实;
3. 随着技术的发展,AI模型未来可能趋向小型化,这有助于降低成本并增加隐私保护。
https://mp.weixin.qq.com/s/Z3ksUSOqGpTfqgGCdjt0Sw
十、 《Tech Unheard》首秀黄仁勋:每天使用ChatGPT,每次演讲都硬着头皮上
1. 黄仁勋日常使用ChatGPT,并认为人工智能技术发展速度惊人;
2. 他描述了英伟达从GPU制造商转变为全栈计算公司的历程;
3. 黄仁勋强调公司文化的透明性和高效的内部信息流动对英伟达成功至关重要。
https://mp.weixin.qq.com/s/UljPUgQszXyptTu1bymY6w