生成式AI
一、 Groq收购Definitive Intelligence公司,或进一步威胁英伟达地位?
1. Groq收购Definitive Intelligence,加强在生成式AI领域的竞争力,或威胁英伟达的市场地位;
2. Groq利用LPU推理引擎显著提升大语言模型处理速度,有望减少生成式AI输出的等待时间;
3. Groq通过GroqCloud业务拓展,提升云平台服务的容量和效率,加速生成式AI应用的部署和开发者支持。
https://mp.weixin.qq.com/s/UJGIHoQ2Isc1YsXuThD1ew
二、 Anthropic公司宣布推出Claude 3模型系列,性能全面超越GPT4
1. Anthropic推出Claude 3系列,超越GPT-4,包括三款性能递增模型:Haiku、Sonnet、Opus,提供先进智能和成本效益平衡;
2. Claude 3具备高级多模态能力,实时支持聊天、自动完成、数据提取,速度快且准确性高,特别是Opus模型在智能水平大幅提升;
3. 引入强大的视觉处理能力,减少拒绝回答率,提高长上下文处理和记忆能力,Opus在复杂问题上准确性提高两倍。
https://mp.weixin.qq.com/s/AqoTriIGzm_AlLtI5AzoDA
三、 OpenAI AGI 时间表疑似泄露!马斯克起诉或让 GPT-5 推迟发布
1. 马斯克诉讼OpenAI,可能导致GPT-5发布延迟,争议集中于OpenAI的开源承诺与实际行为、与微软合作及治理结构;
2. 马斯克强调OpenAI初衷为开放研究,投入显著财力支持,但批评其向闭源转变,与微软合作背离初衷;
3. 疑似内部文件泄露,揭示OpenAI目标在2027年实现AGI,展示AI参数与人脑突触数量对比。
https://mp.weixin.qq.com/s/pjKAcSi25iaLqUrnVmS8_w
四、 2张图2秒钟3D重建!名为DUSt3R的新型AI工具火爆GitHub
1. DUSt3R工具能够使用仅两张图片在不到2秒内完成3D重建,无需任何额外数据或相机校准;
2. 该工具在多个任务上取得了最先进的结果,包括单目/多视图深度估计和相对位姿估计,显示出强大的3D视觉任务处理能力;
3. DUSt3R支持多视图立体重建,通过点图回归方法和全局对准策略,允许从未知相机姿态的照片中恢复几何量,包括相机参数和3D重建效果。
https://mp.weixin.qq.com/s/x9tBrILl8y6klQ3mwDHgOA
五、 文生图平台ideogram发布1.0版本,对标DALL·E3和MidjourneyV6
1. 文生图平台ideogram.ai完成8000万美元A轮融资,由Andreessen Horowitz领投,发布1.0版本,号称超越OpenAI的DALL·E 3和Midjourney V6;
2. ideogram.ai 1.0版本特色包括Magic Prompt文本提示助手,大幅提升画质、样式、长文本理解,同时将图像错误率降低2倍;
3. ideogram.ai支持生成多种图像类型和风格,允许用户对宽高比和像素进行精确设置,满足广泛需求,包括广告设计和媒体传播行业。
https://mp.weixin.qq.com/s/rrxeEtzPL2vT_GlWcizq4w
六、 Mac专属大模型框架来了!两行代码部署,能聊本地数据,支持中文
1. Chat with MLX框架支持Mac用户本地部署大模型,仅需两行代码实现安装和启动;
2. 支持11种语言,自带7种开源大模型,特有的Magic Prompt功能可深度理解并生成图像提示词;
3. 尽管在苹果设备上的计算量负担较大且可能不及N卡玩家体验,本地化部署保障了数据安全性,展现了向消费级产品普及的趋势。
https://mp.weixin.qq.com/s/KDmPnwivHEpfpYGuZIs9oA
七、 突发!苹果「全球最佳的 AI 消费级笔记本电脑」发布,M3芯片
1. 苹果新款MacBook Air搭载M3芯片,支持高达24GB统一内存,提高了性能并支持复杂AI运算;
2. 集成AI功能,包括实时语音转文本、翻译和文本预测等,优化了工作效率和创造力;
3. 支持运行大型语言模型(LLMs)和扩散模型等优化AI模型,提供本地生成图像的极佳性能,号称「全球最佳的AI消费级笔记本电脑」。
https://mp.weixin.qq.com/s/C9hGPqQNYmu9OEziHMT6VQ
八、 7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA
1. 香港科技大学和南方科技大学的研究团队发布GITQA数据集,通过结合视觉图(Visual Graph)和文本模态,探索图推理能力的增强;
2. 在GITQA数据集上,基于LLaVA-7B/13B模型微调的多模态模型GITA-7B/13B展现了超越GPT-4V的图推理性能;
3. 实验表明,视觉图的加入能显著提升模型的图推理能力,特别是在结构复杂的图推理任务上,且数据增强策略(特别是布局增强)能进一步优化模型性能。
https://mp.weixin.qq.com/s/YOlwd_JOmj2tyS1pdCo5fA
前沿科技
九、 长达45年历史的《中美科技合作协定》正式终结?到期了但没续签
1. 《中美科技合作协定》未能续约,标志着双方45年科技合作的终结,可能导致科技领域的脱钩;
2. 《自然》杂志发表社论批评终止协定为“危险的愚蠢之举”,强调合作带来的互惠互利和对全球科技发展的重要性;
https://mp.weixin.qq.com/s/U1NIMzKEmy123Ob4LXKFnw
报告观点
十、 DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力
1. DeepMind CEO Hassabis认为,结合大型语言模型(LLM)和树搜索是实现通用人工智能(AGI)的关键技术路线;
2. 他强调了在现有大模型基础上加入规划和搜索能力的重要性,以及利用网络上的信息和收集的数据作为先验知识来实现AGI的速度;
3. Hassabis提到,DeepMind和Google Brain的合并标志着AI技术发展的新时代,强调了工程能力对于AI科研的重要性,并认为闭源模型在安全性方面优于开源模型。
https://mp.weixin.qq.com/s/MrGnETtEgVE091DqYAxXJw
【往期回顾】
https://docs.qq.com/sheet/DYXVhemNFem1XZ2ZC?tab=BB08J2