生成式AI
一、 TII开源了全球首个Mamba架构大模型Falcon Mamba 7B
1. Falcon Mamba 7B是全球首个通用大型Mamba架构模型,采用SSLM架构,不同于传统的Transformer架构;
2. 在性能上,Falcon Mamba 7B在多个基准测试中超越了同尺寸的领先模型,如Llama 3.1 8B和Mistral 7B;
3. Falcon Mamba 7B能够处理任意长度的序列,无需额外的内存或计算资源,适用于多种企业级应用。
https://mp.weixin.qq.com/s/7Ojw4QJved6UmJ0PHRU2xg
二、 OpenAI官宣:“草莓- Q*”或已经包含在GPT-4o新模型中
1. ChatGPT官方宣布新模型GPT-4o,员工通过行为艺术暗示其为草莓- Q*模型,但用户反馈显示变化微小,未感受到明显改进;
2. 新模型在安全性方面有所增强,尽管如此,一些用户仍然能够通过特定方法破解;
3. 用户和研究者观察到新模型在语气上更人性化,与竞争模型Claude的风格更为接近。
https://mp.weixin.qq.com/s/guV1NbtIfX1IAfSJIouO3g
三、 最强AI程序员易主:84秒跑通代码,类人思维!5人团队
1. AI软件工程师Genie在SWE-Bench榜单中以30.07%的问题解决率领先,实现了57%的性能提升;
2. Genie模仿人类工程师的认知过程和工作流,通过自动迭代分析和代码运行,能在84秒内解决软件问题;
3. Genie由Cosine团队开发,仅5人组成,利用大量真实程序员活动数据和自我改进机制进行训练,提高处理错误的能力。
https://mp.weixin.qq.com/s/YhLyS_FekzRtCG86u2qNDA
四、 首个全自动科学发现AI系统,Sakana AI推出AI Scientist
1. Sakana AI推出AI Scientist,这是首个全自动化科学研究AI系统,能从构思到撰写论文和同行评审的整个科学过程;
2. AI Scientist展示了其多功能性,能在机器学习的多个子领域内生成成本低于15美元的高质量科学论文;
3. 该系统通过自动化科学发现和评审过程,大幅提高科学研究的效率和经济性,推动科学技术领域的创新。
https://mp.weixin.qq.com/s/vdvlGkPmbEUmNVBmoRcuRQ
五、 开源AI视频工具,你只需要当导演,HuggingFace工程师打造
1. Clapper是一款开源AI视频编辑工具,由HuggingFace工程师Julian Bilcke开发,旨在简化视频制作过程;
2. 用户通过调整高级概念如角色、位置等,利用AI代理迭代故事,无需直接编辑视频和音频文件;
3. Clapper集成多个大模型如GPT-4o和Claude 3.5,自动化视频制作的各个环节,尽管目前效果仍需改进。
https://mp.weixin.qq.com/s/ULWoggZpFcyyVp9ViFLPQg
六、 LLM端侧部署新范式T-MAC开源,CPU运算反超NPU
1. T-MAC采用基于查找表(LUT)的计算范式,直接支持低比特计算,消除了反量化需求,显著降低了推理开销;
2. 在CPU上部署的T-MAC超越了NPU的性能,提升了llama模型的生成速度,达到每秒22个token,是llama.cpp框架的4至5倍;
3. T-MAC优化了内存和计算效率,通过查表操作减少了乘法和加法的数量,支持在边缘设备上高效部署低比特大型语言模型。
https://mp.weixin.qq.com/s/9gPydt8Suuhc-zS-FvqdaA
七、 港大发布组合性文生视频基准T2V-CompBench,7大类20项指标
1. 香港大学发布了T2V-CompBench基准测试,首次引入组合性概念,全面评估文生视频模型的能力;
2. T2V-CompBench涵盖7大类20项指标,用于测试视频模型在处理一致属性绑定、动态属性绑定等复杂场景的能力;
3. 通过T2V-CompBench测试20个大模型,结果显示现有技术在处理复杂动态场景时存在明显不足。
https://mp.weixin.qq.com/s/QAN0uP3ulFFfazaE3VB2IA
前沿科技
八、 Alphabet 旗下Waymo将robotaxi服务扩至旧金山高速公路
1. Waymo 将自动驾驶出租车服务扩展至旧金山高速公路,首次允许公司员工乘坐完全无人驾驶的汽车;
2. Waymo 的无人驾驶汽车能够自主出入匝道和在车道间穿梭,显著提升乘客体验并缩短行程时间;
3. 尽管面临技术和安全挑战,Waymo 在旧金山的高速公路服务标志着自动驾驶技术的重要进展,并为未来扩展至其他城市奠定基础。
https://mp.weixin.qq.com/s/p0pi5KY8iu3_DcmSP_RRPg
报告观点
九、 ChatGPT狂飙600多天后,中国有近8万家AI公司已消失
1. 自ChatGPT发布以来,中国约有78,612家AI相关公司因各种挑战而关闭,占同期新注册公司的8.9%;
2. 过去三年内,中国有超过20万家AI相关企业被注销或吊销,显示出AI行业的高淘汰率;
3. 尽管AI创业热潮导致大量新公司成立,高算力成本和融资困难导致许多企业无法持续运营。
https://mp.weixin.qq.com/s/DQFoGETLNJ6Tmaog3Tg_7Q
十、 「AI数据荒」雪上加霜,MIT:网页数据的公开共享正走向衰落
1. 网页数据的公开共享正在减少,导致AI训练数据变得难以获取,加剧了「AI数据荒」;
2. 研究发现,开源数据集如C4、RefineWeb、Dolma中的网站正在增加对爬虫的限制,导致可用的开放数据减少;
3. 这种数据获取限制不仅影响商业AI模型的训练,也对学术和非营利研究造成阻碍。
https://mp.weixin.qq.com/s/MypgPc4lWW7UHh2oCQmGBQ
👇订阅下方合集,获取每日推送