生成式AI
一、 超级AI诞生?史上最强超算9月上线,英伟达最强芯片加持
1. SingularityNET公司的新型超级计算机将于9月上线,配备英伟达最强GPU,旨在推动人类级别的人工智能(AGI)发展;
2. 超算采用多层次认知计算网,包括深度神经网络、大型语言模型(LLM)和多模态系统,支持复杂AI系统训练;
3. 超算网络使用先进硬件如NVIDIA L40S GPU和AMD处理器,结合新型神经-符号AI方法,减少资源需求,提高计算效率。
https://mp.weixin.qq.com/s/SrSdRY1_M-eOGsFIJuTTvQ
二、 马斯克突然发布 Grok 2大模型 ,能解「9.8 和 9.11 哪个大」
1. Grok-2, 新一代大模型,已在性能上与GPT-4o相媲美,特别在编码、复杂问题解决及数学方面表现出色;
2. 模型包括Grok-2和Grok-2 mini两个版本,均已在X平台上向用户发布,展示了显著的进步和多模态理解能力;
3. xAI计划通过新的企业API平台发布Grok-2,强化安全功能,并通过新计算集群提升模型核心推理能力。
https://mp.weixin.qq.com/s/nBaY2srcMSzvEoecOyh1Cg
三、 谷歌版Her,抢先OpenAI登场,高级语音模型Gemini Live
1. 谷歌推出Gemini Live语音模型,将在全球30亿安卓和22亿iOS设备上线,提供自然对话体验和多种声音选择;
2. Gemini深度集成安卓和Pixel设备,支持跨应用程序操作和上下文感知功能,提高用户交互便利性;
3. Gemini Live面临技术挑战,包括安全问题和实时演示中的技术故障,但谷歌决定快速推进以竞争市场领先地位。
https://mp.weixin.qq.com/s/mR5XpquGCcd6HNrptBnw0Q
四、 最强智能体Agent Q发布!Llama 3零样本成功率提升340%
1. Agent Q是一个自监督智能体,能通过互联网任务进行自我对弈和强化学习,具备推理、规划和自我修复功能;
2. 利用Llama 3模型,Agent Q在一天内将零样本成功率提升340%,特别在真实世界预订任务中表现出色;
3. 结合引导式蒙特卡洛树搜索(MCTS)和直接偏好优化(DPO),Agent Q提高了多步推理任务的泛化能力和成功率。
https://mp.weixin.qq.com/s/xVB7ZiCsrNbCrQZKb2mwjA
五、 没有等来OpenAI开源GPT-4o,等来了腾讯的开源版VITA
1. VITA是由腾讯优图等机构开发的首个开源多模态大语言模型(MLLM),能同时处理视频、图像、文本和音频,提供多模态交互体验;
2. 采用Mixtral 8×7B为基础,进行双语指令微调和多模态对齐,增强了视觉和音频能力;
3. VITA实现了非唤醒交互和音频中断的人机交互功能,通过复式部署模型,提高了环境输入的连续跟踪能力。
https://mp.weixin.qq.com/s/_ILH_GZaKMUlRaqsZBU0Eg
六、 全球首个AI流媒体音乐App来了!一直生成一直听,国产
1. 昆仑万维开发的全球首个AI流媒体音乐App Melodio,提供无限流式AI生成音乐,支持中英文歌曲生成;
2. Melodio允许用户通过简单的Prompt输入生成音乐,同时提供歌曲参考模式,增强音乐生成的多样性和个性化;
3. 昆仑万维还推出了Mureka,一个AI音乐创作平台,使用类Sora架构,支持高质量音频生成,提升音乐创作的易用性和专业性。
https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
七、 苹果大模型新成果:GPT-4o扮演用户,考察大模型工具调用
1. 苹果发布新开源Benchmark ToolSandbox,采用场景化测评方法,考察大模型在真实环境中的工具调用能力;
2. ToolSandbox测试包括对话交互和状态依赖场景,使用GPT-4o模拟用户与模型进行交互,提高测试的实际应用相关性;
3. 测试结果显示闭源模型如GPT-4o表现优于开源模型,尤其在多工具调用和多轮对话任务中,但所有模型在状态依赖任务和规范化场景中面临挑战。
https://mp.weixin.qq.com/s/O1uf5y0aCjVIvsvRVkdBBw
前沿科技
八、 谷歌同步发布Pixel 9 ,让 Android 的 AI 体验抢先 iOS一步
1. Google发布Pixel 9系列,首次将大型多模态AI模型Gemini Nano整合进Android系统,提前于iOS实现设备内AI功能;
2. Pixel 9系列包括四款AI手机,具备高级语音功能Gemini Live,支持多应用跨界调用和AI图像功能;
3. 由Gemini Live提供自由流畅的交流体验,支持免提功能,允许用户在多种场景下无缝与AI进行互动。
https://mp.weixin.qq.com/s/w6BmotpEqxtgNZDtxvND8Q
报告观点
九、 “L2越厉害,就离L4越远”和楼天城聊Robotaxi和AI世界观
1. 楼天城认为L2自动驾驶技术的高度发展与L4自动驾驶技术的目标相距甚远,反之亦然;
2. 在自动驾驶技术发展中,数据的多少并非决定性因素,当自动驾驶技术超越人类水平后,过多的数据可能成为干扰项;
3. 自动驾驶的发展需要通过多个阶段,每个阶段都有其关键技术和挑战,例如从1000小时到10000小时的跳跃需要考虑如何降低其他车辆的风险。
https://mp.weixin.qq.com/s/0_wiRFV-ZTF9pWvk_CCkkQ
十、 菲尔茨奖得主陶哲轩最新演讲:AI 将催生出一个大数学时代
1. 陶哲轩认为AI将推动数学进入一个新的大数学时代,尤其在数学证明和计算领域显示出巨大潜力;
2. 他指出AI在数学上的实现相对普通,主要通过输入数字和权重计算,但其对数学研究方式的潜在改变是革命性的;
3. 陶哲轩强调,尽管AI在生成准确结果方面有时会出现问题,但其在处理大规模数学项目和形式化验证方面的应用前景令人期待。
https://mp.weixin.qq.com/s/e0K_bfOqYew8H0_P1fPh2Q
👇订阅下方合集,获取每日推送