生成式AI
一、 OpenAI断供,智谱AI专门面向OpenAI API用户,提供特别搬家计划
1. OpenAI将于7月9日终止对某些国家的API服务,包括中国;
2. 智谱AI推出“特别搬家计划”,帮助OpenAI用户迁移到国产大模型,提供详尽的迁移支持和优惠;
3. AI Infra厂商硅基流动免费提供国内顶尖开源大模型token,加速国产大模型的替代推广。
https://mp.weixin.qq.com/s/WF32MEhTbSk1fqWX5akAQg
二、 OpenAI 又收购一家公司,远程协作平台 Multi,在企业解决方案领域发力
1. OpenAI收购了远程协作公司Multi,继续扩展其企业解决方案战略;
2. Multi公司支持最多10人的屏幕共享协作,并提供自定义快捷方式及自动链接功能;
3. Multi团队成员将加入OpenAI,公司将在7月24日关闭。
https://mp.weixin.qq.com/s/JjMBJ6iUQdhaglqCkldTag
三、 Suno、Udio被环球、索尼、华纳三巨头联合起诉,每首索赔15万美元
1. 环球音乐集团、索尼音乐娱乐和华纳唱片联合起诉Suno和Udio,指控这两家公司未经授权使用知名歌曲;
2. 要求Suno和Udio为每件侵权作品支付15万美元的版权损失费;
3. 法庭证据显示Suno和Udio的AI生成音乐复制了原有歌曲的歌词和风格,如披头士的歌曲风格和ABBA的歌词。
https://mp.weixin.qq.com/s/7aFbNgL6ElnXjQFYOgGu0w
四、 苹果上新视觉模型4M-21,搞定RGB、几何特征图、元数据等21种模态
1. 苹果与EPFL联合开发的4M-21视觉模型能处理21种模态,包括图像、文本和结构化数据,提升跨模态检索和生成能力;
2. 模型通过对不同模态执行特定离散tokenization,实现统一处理,并在多数据集上联合训练,增强性能和适应性;
3. 4M-21展示了优异的多模态生成、检索能力,并在实验中证明其开箱即用的强大视觉任务执行能力。
https://mp.weixin.qq.com/s/OI4bAYrxATFP20BFrlqSog
五、 用了几天新版微信输入法,我觉得微信里的 AI 「问 AI」体验被低估了
1. 微信输入法1.2.0版本引入「问AI」功能,结合AI大模型,允许用户直接在输入栏与AI交互;
2. 「问AI」基于腾讯自研混元大模型,提取微信读书文库内容,旨在提供深度信息而非即时性或外文资料;
3. 此功能专注于简化用户提问流程,与一般聊天AI文案生成或角色扮演或传统搜索引擎等应用不同,提供差异化价值。
https://mp.weixin.qq.com/s/FjE54HIrFSq0uHJN0swVgQ
六、 最新爆火3D生成模型,开源模型Unique3D,清北硬核00后成团出击
1. Unique3D模型由清北团队开发,以开源形式发布,可30秒内将单张图片转换为高质量3D模型;
2. 模型优化处理了传统3D生成的几何质量和纹理一致性问题,使用多视图生成和高分辨率上采样技术;
3. 团队背景强大,已完成三轮融资,并计划引入更多创新功能,如全景3D生成和视频人物替换。
https://mp.weixin.qq.com/s/Kq394HFG3UTW-xuAmOn_ww
七、 百倍提升7B模型推理能力!颜水成团队携手南洋理工大学发布Q*算法
1. 颜水成团队与新加坡南洋理工大学合作发布Q*算法,显著提升7B模型推理能力,效能提高百倍;
2. Q*算法结合A*搜索和Q-learning技术,优化多步推理,减少计算资源需求;
3. 实验结果显示,在多个数据集上Q*性能优于ChatGPT和Gemini Ultra,为小模型提供类似大模型的推理能力。
https://mp.weixin.qq.com/s/5zaE62vFQg-v_gx2o6Dmdg
八、 国产厨电龙头老板电器最新发布「食神」大模型,全球首个烹饪大模型
1. 食神大模型是全球首个烹饪领域的大模型,由老板电器发布,依托数十亿级行业数据和数千万级知识图谱;
2. 该模型提供个性化烹饪解决方案,能识别食材图片,基于用户偏好提供多种烹饪方法,并在烹饪过程中进行情绪感知和情感陪伴;
3. 实现一体化操作和跨设备协同,通过与多种厨房设备的联动,支持从食材处理到完成菜品的全流程自动化操作。
https://mp.weixin.qq.com/s/DfgNfAQZvHedHD-GgYCHXA
前沿科技
九、 浪潮获CVPR2024自动驾驶国际挑战赛“Occupancy & Flow”赛道冠军
1. 浪潮信息AI团队通过“F-OCC”算法模型在CVPR 2024自动驾驶挑战赛的“Occupancy & Flow”赛道中获得冠军,表现优异;
2. “F-OCC”模型结合了先进的模型结构设计和数据处理能力,特别是在3D体素数据处理和可形变卷积技术的应用中表现出色;
3. 模型在环形相机图像的栅格占据和运动预测中实现了高准确度,使用CUDA优化的DCN3D技术显著提升了计算效率和预测能力。
https://mp.weixin.qq.com/s/BFgjI9c-QlV-dJvV1QN2pw
报告观点
十、 面壁智能李大海:聚焦端侧,2026 年可以做到 GPT-4 水平的端侧模型
1. 面壁智能的李大海计划到2026年实现端侧GPT-4水平模型,表达了对Scaling Law的独特解读和应用;
2. 端侧模型被视为AI落地的实际途径,因其能紧密结合用户的隐私和环境互动,提供无所不在的智能;
3. 李大海强调端侧模型需实现“三位一体”:感知、决策、行为,使AI更懂用户,共享上下文和行为调整相结合。
https://mp.weixin.qq.com/s/oemEFwi7tLZBtB_rIm3y0A
👇订阅下方合集,获取每日推送