生成式AI
一、 Mistral放大招:124B多模态,Canvas、搜索、图片生成免费用
1. Mistral AI发布Pixtral Large,具备1240亿参数,拥有SOTA多模态性能,支持文档、图表和自然图像理解;
2. 全新Le Chat具备网页搜索、Canvas、图像生成等功能,完全免费,适用于创意、编码等多种任务;
3. Le Chat通过Pixtral Large 2增强,支持快速准确理解文档和图像生成,适用于自动化重复工作流。
https://mp.weixin.qq.com/s/zFgr2WmWZurQ6KhnThx_Qg
二、 北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超强
1. 北大等团队发布了首个多模态版o1开源模型LLaVA-o1,基于Llama-3.2-Vision模型,采用结构化、多步骤推理,超越传统思维链提示;
2. LLaVA-o1在多模态推理基准测试中超越基础模型8.9%,并在性能上超越了多种开闭源模型;
3. LLaVA-o1通过监督微调和阶段级光束搜索方法提升推理能力,团队宣布即将开源代码、预训练权重和数据集。
https://mp.weixin.qq.com/s/GicLwdIgkFUpm7tCFkDbyg
三、 Perplexity AI公司将进军电商!付费用户可享受精准购物推荐!
1. Perplexity 推出新的购物功能,允许付费用户在搜索结果中获得购物推荐并直接下订单;
2. 该功能集成了卖家网站信息,提供产品详情、价格、卖家信息和一键结账服务;
3. Perplexity 推出商家计划,商家可免费获得 API 访问权限,且公司不从用户购买中抽取佣金。
https://mp.weixin.qq.com/s/zjuWzyoHjKcFCp0LXotUNg
四、 在「最难LLM评测榜单」上,阶跃万亿参数模型拿下中国第一
1. 阶跃星辰的万亿参数模型 Step-2 在 LiveBench AI 榜单上获得第五名,成为唯一进入前十的国产大模型;
2. Step-2 模型采用自主研发的 MoE 架构,从头开始训练,突破了多项关键技术,展示了强大的语言生成控制力;
3. 阶跃星辰在短时间内发布了多个大模型,并接入智能助手跃问和 AI 开放世界冒泡鸭,展现出强势崛起的姿态。
https://mp.weixin.qq.com/s/rGv2r_-owZ3jIx3IPk6XfQ
五、 从 GPT-2 开始玩 AI 的博士生,把论文做成了 Steam 独立游戏
1. 《1001 夜》是一款由 AI 扮演国王的叙事游戏,玩家通过讲故事诱导国王说出武器关键词,集齐武器打败国王;
2. 游戏利用大语言模型实时生成武器卡牌、场景和战斗台词,提供独特的游戏体验;
3. 开发者起司强调 AI 在游戏中的应用,并致力于平衡技术与创作之间的关系,展示 AI 的有趣一面。
https://mp.weixin.qq.com/s/8GbnTYfmUunZMSH_ajHWHA
六、 1000个人类被采访「克隆」进西部世界,相似度85%细节太炸裂
1. 通过访谈生成的AI智能体在模拟人类行为上达到了85%的准确率;
2. 基于访谈的智能体在种族和意识形态群体之间减少了准确性偏差,更能反映真实个体的独特因素;
3. AI访谈员通过深度访谈方法,动态生成问题,确保高质量数据,成功创建了1000多个类人生成式智能体。
https://mp.weixin.qq.com/s/FKLCKHhP7xgYArLISDdiaw
七、 AI能办信用卡,Agent自己赚钱自己花?OpenAI合作伙伴打造
1. Stripe发布的SDK允许AI智能体使用一次性虚拟卡完成金融支付,支持与多种平台集成,并通过函数调用实现自动化交易流程;
2. AI智能体可以通过整合函数调用和支付API,完成从搜索航班到最终支付的整个流程,甚至可以自动生成和使用虚拟卡;
3. AI智能体不仅能完成支付任务,还能通过接收捐款等方式实现“自己赚钱自己花”,但目前银行卡户头仍需人类控制。
https://mp.weixin.qq.com/s/R_svNnDilRoi5BAjyMHhhw
八、 英伟达发布实时数字孪生,携手3大云巨头引爆AI工业时代
1. 英伟达发布Omniverse Blueprint技术,支持实时物理数字孪生系统,推动航空航天、汽车制造等行业进入AI时代;
2. Omniverse Blueprint整合Nvidia CUDA-X库、Modulus物理AI框架和Omniverse API,实现实时物理求解和大规模数据集可视化;
3. Ansys、Luminary Cloud等公司采用Omniverse Blueprint,加速计算流体动力学模拟,显著提高工程和设计效率。
https://mp.weixin.qq.com/s/IqAejv7hfanYXtMPzuxokA
前沿科技
九、 AlphaFold3级开源可商用,MIT推出生物分子预测模型Boltz-1
1. MIT团队推出的Boltz-1是第一个完全商业化的开源模型,达到了AlphaFold3级精度;
2. Boltz-1通过MIT许可免费提供训练和推理代码、模型权重和数据集,旨在成为全球研究人员的建模主干;
3. 虽然Boltz-1性能强大,但存在幻觉现象,研究人员计划通过未来迭代改进模型。
https://mp.weixin.qq.com/s/uYedLz6__YXlhnzw25Z2OA
报告观点
十、 马斯克与 OpenAI 的「混乱分手」内幕:人才、AGI、权力争夺
1. 马斯克起诉 OpenAI,指控其与微软的反竞争合作关系,揭露了双方早期合作和权力斗争的细节;
2. OpenAI 从非营利组织转变为营利性公司,争夺顶尖人才和资金,面临与科技巨头的激烈竞争;
3. 马斯克与 Altman 因对 AGI 控制权的分歧导致关系破裂,马斯克离开 OpenAI 董事会并创办 xAI。
https://mp.weixin.qq.com/s/k7P6CrkMC10U2vZnZ_obyg