当前位置:首页|资讯|腾讯|英伟达|生成式AI|大语言模型

腾讯研究院AI速递 20240305

作者:腾讯研究院发布时间:2024-03-05

原标题:腾讯研究院AI速递 20240305

生成式AI

一、 Groq收购Definitive Intelligence公司,或进一步威胁英伟达地位?

1. Groq收购Definitive Intelligence,加强在生成式AI领域的竞争力,或威胁英伟达的市场地位;

2. Groq利用LPU推理引擎显著提升大语言模型处理速度,有望减少生成式AI输出的等待时间;

3. Groq通过GroqCloud业务拓展,提升云平台服务的容量和效率,加速生成式AI应用的部署和开发者支持。

https://mp.weixin.qq.com/s/UJGIHoQ2Isc1YsXuThD1ew

二、 Anthropic公司宣布推出Claude 3模型系列,性能全面超越GPT4

1. Anthropic推出Claude 3系列,超越GPT-4,包括三款性能递增模型:Haiku、Sonnet、Opus,提供先进智能和成本效益平衡;

2. Claude 3具备高级多模态能力,实时支持聊天、自动完成、数据提取,速度快且准确性高,特别是Opus模型在智能水平大幅提升;

3. 引入强大的视觉处理能力,减少拒绝回答率,提高长上下文处理和记忆能力,Opus在复杂问题上准确性提高两倍。

https://mp.weixin.qq.com/s/AqoTriIGzm_AlLtI5AzoDA

三、 OpenAI AGI 时间表疑似泄露!马斯克起诉或让 GPT-5 推迟发布

1. 马斯克诉讼OpenAI,可能导致GPT-5发布延迟,争议集中于OpenAI的开源承诺与实际行为、与微软合作及治理结构;

2. 马斯克强调OpenAI初衷为开放研究,投入显著财力支持,但批评其向闭源转变,与微软合作背离初衷;

3. 疑似内部文件泄露,揭示OpenAI目标在2027年实现AGI,展示AI参数与人脑突触数量对比。

https://mp.weixin.qq.com/s/pjKAcSi25iaLqUrnVmS8_w

四、 2张图2秒钟3D重建!名为DUSt3R的新型AI工具火爆GitHub

1. DUSt3R工具能够使用仅两张图片在不到2秒内完成3D重建,无需任何额外数据或相机校准;

2. 该工具在多个任务上取得了最先进的结果,包括单目/多视图深度估计和相对位姿估计,显示出强大的3D视觉任务处理能力;

3. DUSt3R支持多视图立体重建,通过点图回归方法和全局对准策略,允许从未知相机姿态的照片中恢复几何量,包括相机参数和3D重建效果。

https://mp.weixin.qq.com/s/x9tBrILl8y6klQ3mwDHgOA

五、 文生图平台ideogram发布1.0版本,对标DALL·E3和MidjourneyV6

1. 文生图平台ideogram.ai完成8000万美元A轮融资,由Andreessen Horowitz领投,发布1.0版本,号称超越OpenAI的DALL·E 3和Midjourney V6;

2. ideogram.ai 1.0版本特色包括Magic Prompt文本提示助手,大幅提升画质、样式、长文本理解,同时将图像错误率降低2倍;

3. ideogram.ai支持生成多种图像类型和风格,允许用户对宽高比和像素进行精确设置,满足广泛需求,包括广告设计和媒体传播行业。

https://mp.weixin.qq.com/s/rrxeEtzPL2vT_GlWcizq4w

六、 Mac专属大模型框架来了!两行代码部署,能聊本地数据,支持中文

1. Chat with MLX框架支持Mac用户本地部署大模型,仅需两行代码实现安装和启动;

2. 支持11种语言,自带7种开源大模型,特有的Magic Prompt功能可深度理解并生成图像提示词;

3. 尽管在苹果设备上的计算量负担较大且可能不及N卡玩家体验,本地化部署保障了数据安全性,展现了向消费级产品普及的趋势。

https://mp.weixin.qq.com/s/KDmPnwivHEpfpYGuZIs9oA

七、 突发!苹果「全球最佳的 AI 消费级笔记本电脑」发布,M3芯片

1. 苹果新款MacBook Air搭载M3芯片,支持高达24GB统一内存,提高了性能并支持复杂AI运算;

2. 集成AI功能,包括实时语音转文本、翻译和文本预测等,优化了工作效率和创造力;

3. 支持运行大型语言模型(LLMs)和扩散模型等优化AI模型,提供本地生成图像的极佳性能,号称「全球最佳的AI消费级笔记本电脑」。

https://mp.weixin.qq.com/s/C9hGPqQNYmu9OEziHMT6VQ

八、 7B模型超越GPT4-V!港科大等发布「图推理问答」数据集GITQA

1. 香港科技大学和南方科技大学的研究团队发布GITQA数据集,通过结合视觉图(Visual Graph)和文本模态,探索图推理能力的增强;

2. 在GITQA数据集上,基于LLaVA-7B/13B模型微调的多模态模型GITA-7B/13B展现了超越GPT-4V的图推理性能;

3. 实验表明,视觉图的加入能显著提升模型的图推理能力,特别是在结构复杂的图推理任务上,且数据增强策略(特别是布局增强)能进一步优化模型性能。

https://mp.weixin.qq.com/s/YOlwd_JOmj2tyS1pdCo5fA

前沿科技

九、 长达45年历史的《中美科技合作协定》正式终结?到期了但没续签

1. 《中美科技合作协定》未能续约,标志着双方45年科技合作的终结,可能导致科技领域的脱钩;

2. 《自然》杂志发表社论批评终止协定为“危险的愚蠢之举”,强调合作带来的互惠互利和对全球科技发展的重要性;

https://mp.weixin.qq.com/s/U1NIMzKEmy123Ob4LXKFnw

报告观点

十、 DeepMind CEO:LLM+树搜索就是AGI技术线路,AI科研依赖工程能力

1. DeepMind CEO Hassabis认为,结合大型语言模型(LLM)和树搜索是实现通用人工智能(AGI)的关键技术路线;

2. 他强调了在现有大模型基础上加入规划和搜索能力的重要性,以及利用网络上的信息和收集的数据作为先验知识来实现AGI的速度;

3. Hassabis提到,DeepMind和Google Brain的合并标志着AI技术发展的新时代,强调了工程能力对于AI科研的重要性,并认为闭源模型在安全性方面优于开源模型。

https://mp.weixin.qq.com/s/MrGnETtEgVE091DqYAxXJw

【往期回顾】

https://docs.qq.com/sheet/DYXVhemNFem1XZ2ZC?tab=BB08J2


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1