本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的AI团队；Googe发布文生视频模型Lumiere

作者：王怡宁发布时间：2024-01-29

作者 | 王怡宁

编辑 | 邓咏仪尚恩

一周纵览

本周硅谷大厂最值得关注的，是各家的大模型均有不少上新。OpenAI宣布了多项模型更新，同时发布了GPT-4 Turbo预览模型，提升了代码生成能力。Google发布文本生成视频模型Lumiere，生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量，组建新的GenAI团队研发小模型，减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy，官方称跑分表现仅次于GPT4-V和Gemini Ultra。

同时，国内大模型也有不少进展，通义千问团队升级了视觉语言模型Qwen-VL，图片内文字处理能力得到提升。此外，第四批国产AI大模型备案获批，14款大模型及产品获得备案审批，备案企业已经从以大厂、AI厂商、AI研究机构为主，快速覆盖到了各个垂直行业。

另外，苹果本周宣布在欧洲地区做出重大更新，允许第三方应用商店在iOS设备上运行，这是2008年以来苹果首次针对第三方下载问题做出让步。

融资方面，本周AI领域融资较为活跃，成立仅两年的语音AI初创公司ElevenLabs获8000万美元融资，跻身AI独角兽俱乐部。此外，初创公司Sierra完成了由红杉资本领投的A轮投资，估值将达10亿美元。

Key Points

微软组建新团队来造更轻且便宜的AI模型

OpenAI大降价，同时发布多项更新

Google团队发布文本生成视频模型Lumiere

Adept AI发布多模态模型Fuyu-Heavy，跑分测试表现出色

通义千问视觉语言模型Qwen-VL系列升级

第四批国产AI大模型备案获批，更多垂直厂商入局

OpenAI悄悄放弃向公众披露关键文档的承诺

苹果计划在欧洲地区开放第三方应用商店

蚂蚁成立Al创新部NextEv，负责人系前GoogleAl工程师

Google更新Chrome浏览器，将新增3个AI功能

又有三名Google DeepMind员工离职创业

语音AI初创ElevenLabs获8000万美元融资，新晋独角兽

OpenAI董事成立的公司Sierra获8500万美元投资，红杉资本领投

AI摄影应用Artisse AI筹集670万美元种子资金

AI初创Fusemachines宣布以SPAC方式在美上市

腾讯文档 AI 开启公测，支持一句话生成Word/Excel/PPT

Google发布Art Selfie2.0版本，自由创建艺术自拍

苹果计划在2028年推出第一款电动汽车Apple Car

Pika联手北大斯坦福发表论文，开源文生图框架

大模型第一线

微软组建新团队来造更轻且便宜的AI模型

1月23日，据The information援引两位知情人士消息，微软正在组建新的GenAI团队，将专注于开发更小的语言模型(SLM) ，该团队将由微软公司副总裁Misha Bilenko领导，微软内部多名顶级研究人员已加入该团队。分析认为微软希望通过这种方式节约成本，并减少对OpenAI的依赖。

OpenAI大降价，同时发布多项更新

1月25日，OpenAI宣布将于下周推出全新GPT-3.5 Turbo模型，将输入价格降低了50%，输出价格降低25%，这也是GPT-3.5 Turbo在一年内的第三次降价。OpenAI还更新了GPT-4 Turbo预览模型，能更好完成代码生成类任务。另外，两款全新文本嵌入模型text-embedding-3也上线了，OpenAI还将更新API使用和管理方法，让开发人员更清楚地了解API使用情况。

△智能涌现制图

Google团队发布文本生成视频模型Lumiere

1月24日，Google研究员Hila Chefer在社交媒体X上宣布，文生视频模型Lumiere正式上线。研究团队为Lumiere引入了时空U-Net架构，使得生成视频在运动幅度和一致性表现良好，同时提供多种风格选择，支持生成内容的局部修改。

△图源：Google

Adept AI发布多模态模型Fuyu-Heavy，跑分测试表现出色

1月24日，Adept AI发布了最新的多模态模型Fuyu-Heavy，并称目前其能力是全球排名第三的多模态模型，仅次于GPT4-V和Gemini Ultra，但其规模仅为它们的1/10-1/20。Fuyu-Heavy在基准测试跑分中表现突出，部分得分超过Gemini Pro。Adept成立于2022年，创始人包括Google Transformer架构的提出者Ashish Vaswani和Niki Parmar，及OpenAI前工程副总裁David Luan。

通义千问视觉语言模型Qwen-VL系列升级

1月22日，阿里云通义千问团队公布了视觉语言模型Qwen-VL系列的更新。此次更新包含Qwen-VL-Plus和Qwen-VL-Max两个版本，模型在图像相关的推理能力、图中文字识别和提取能力，以及支持高分辨率三个方面做了升级。据通义千问数据，相比于开源版本的Qwen-VL，这两个模型在多项图文多模态标准测试中获得了堪比Gemini Ultra和GPT-4V的水准。

第四批国产AI大模型备案获批，更多垂直厂商入局

1月26日，36氪获悉，国内新一批通过大模型备案审批的企业名单正式出炉，包括13家企业的14款模型及产品获得备案审批。从2023年8月第一批企业和机构算起，本次公布已是第四批的企业名单。同时，备案企业已经从以大厂、AI厂商、AI研究机构为主，快速覆盖到了各个垂直行业，其中电商零售、社交、招聘等细分赛道的公司较为活跃。

△智能涌现制图

大事件

OpenAI悄悄放弃了向公众披露关键文档的承诺

据《连线》杂志1月24日消息，在公司董事会会议结束后，OpenAI拒绝了《连线》杂志要求提供完整财务信息的请求。在此之前，OpenAI向美国税务当局提交的报告曾称，任何公众都可以查看公司管理文件、财务报表等文件的副本。但OpenAI负责人表示，其信息公开政策自2022年后已经改变，并只提供了一份略去大部分业务的财务报表副本。

苹果计划在欧洲上线第三方应用商店

1月25日，苹果公司宣布将允许欧洲地区第三方应用商店在 iOS上运行，以响应欧盟将于三月生效的《数字市场法》(DMA)，这是2008年以来苹果首次针对第三方下载问题做出让步，也将打破苹果应用商店作为iPhone应用程序唯一分销商的地位。同时，开发者可以选择继续使用苹果的支付服务和应用内购买，或整合第三方支付系统，而无需向苹果支付额外费用。

蚂蚁集团成立Al创新部NextEv，前GoogleAl工程师徐鹏担任负责人

1月24日，36氪独家获悉，蚂蚁集团已在内部成立了A创新研发与应用部门NextEvO，由蚂蚁集团副总裁徐鹏担任负责人。徐鹏曾在Google工作11年，负责和领导了Google翻译的核心技术研发，并参与了显示广告系统的算法研发。NextEvo是蚂蚁内部的Al精税部门，承担了蚂蚁Al的所有核心技术研发，包括蚂蚁百灵大模型的所有研发工作。

Google更新Chrome浏览器，将新增3个AI功能

1月23日，Google发布Chrome M121版本，并宣布将引入3个新的AI功能。新增功能包括本周上线的标签管理器，将在下个月上线的文本写作助手功能，以及在浏览器中自定义主题的功能。早在去年9月，微软Bing就推出了基于人工智能的标签分组和文本组合助手，但是Chrome仍然在美国浏览器市场上占有绝对优势，此举也有助于Chrome巩固其市场份额。

又有三名Google DeepMind员工离职创业

1月24日，据The information援引两位知情人士消息，三位DeepMind研究人员近期离开Google，创办了人工智能初创企业Uncharted Labs。此前，他们在Google负责开发生成图像和音乐的相关研究工作。消息人士称，新公司已经在2个月内筹集到了850万美元。近期员工流失问题也引起了Google管理层的注意，他们正在通过加薪和授予股票激励的方式留住AI人才。

融资动态

语音AI初创公司ElevenLabs获8000万美元融资，新晋AI独角兽

1月22日，成立于2022年的AI语音初创公司ElevenLabs正式宣布，已经完成了8000万美元的B轮融资，投资方包括Andreessen Horowitz、Nat Friedman和Daniel Gross，红杉资本等。ElevenLabs能够将文本转换成语音，并且支持多种模仿不同年龄、性别等人的语音、口音甚至情感，让电影配音更加像“真人”，其客户包含不少游戏巨头和电影制片厂。

OpenAI董事成立的公司Sierra获8500万美元投资，红杉资本领投

据彭博社1月26日援引知情人士消息，企业级人工智能初创公司Sierra近期完成了A轮投资，红杉资本预计将领投8500万美元的投资，如果融资完成，Sierra估值将达10亿美元左右，成为新的独角兽。Sierra由Salesforce前联席CEO Bret Taylor和Google高管Clay Bavor在去年联合创立，公司的具体业务尚未有更多公开信息。

AI摄影应用Artisse AI获670万美元种子轮融资

据TechCrunch1月24日消息，AI照片生成应用Artisse筹集到了670万美元的种子资金，由伦敦基金会（The London Fund）领投。Artisse允许用户上传自己的照片，然后生成不同姿势和风格的照片，其相对于同类软件的优势是真实感更强。到目前为止，这款应用已经被下载了超过20万次，用户最初可以享受25张免费照片额度，后续每生成一张照片收费20美分。

AI初创公司Fusemachines宣布以SPAC方式在美上市

1月23日，企业人工智能产品和解决方案提供商Fusemachines与特殊目的收购公司CSLM Acquisition Corp.宣布签署业务合并最终协议，帮助Fusemachines以SPAC方式在纳斯达克上市，该交易估值约为2亿美元。Fusemachines成立于2013年，公司利用专有的AI Studio和AI引擎，帮助推动客户的AI企业转型，其客户包括时代杂志出版商、Coach母公司Tapestry等。

新玩意

腾讯文档AI开启公测，支持一句话生成Word/Excel/PPT

1月26日，腾讯文档智能助手正式开启公测，全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。此次公测腾讯文档AI能力带来全新升级，涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力，并支持跨品类文档内容畅通流转。

△图源：腾讯文档

Google发布Art Selfie2.0版本，人人都可以创建自己的艺术自拍

1月24日，Google旗下应用艺术与文化（Arts & Culture）上线了Art Selfie2.0版本，让用户利用生成式AI技术生成艺术品风格的自拍，目前该应用支持超过25种艺术风格。2018年，Google就推出了Art Selfie1.0，帮助用户在艺术史上找到自己的翻版，此次更新的重点是加入了AI功能，同时在生成照片时让用户可以了解到相关艺术风格的历史。

△图源：Google Arts & Culture

苹果计划在2028年推出第一款电动汽车Apple Car

据彭博社1月23日消息，苹果预计在2028年推出其第一款电动汽车Apple Car，并支持部分自主驾驶功能。苹果电动汽车项目“泰坦计划”(Project Titan) 自2015年以来一直在进行，但该项目面临多次延误和高管更替。彭博社称，苹果董事会去年向库克施压，要求其提供泰坦计划的交付计划，或者完全取消该项目。报告称，该项目最初的计划是制造一款没有方向盘的全自动汽车，但此前从未产出过可行的原型。

前沿研究

Pika联手北大斯坦福发表论文，开源文生图框架

1月24日，Pika研究中心在社交媒体X上发布动态，宣布Pika与北京大学、斯坦福大学合作开发的文本生成图像框架RPG-DiffusionMaster上线，同时文章和代码均已开源。RPG框架在上下文和组合语义对齐方面取得了显著的进步，还支持多轮对话编辑功能。

△图源：Pika

论文地址：
https://arxiv.org/abs/2401.11708

👇🏻 扫码加入「智涌AI交流群」👇🏻

欢迎交流

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的AI团队；Googe发布文生视频模型Lumiere

一周纵览

Key Points

大模型第一线

大事件

融资动态

新玩意

前沿研究

推荐体验

相关资讯

马斯克夺下AI.com域名；OpenAI提交GPT-5商标申请；亚马逊组建AI大模型团队 | 本周硅谷发生了什么？

本周硅谷发生了什么？| OpenAI发布DALL·E 3；微软官宣Copilot全家桶；马斯克脑接口公司招募人体试验者

斯坦福AI虚拟小镇开源；英伟达再推超级芯片；OpenAI发布爬虫机器人 | 本周硅谷发生了什么？

谷歌DeepMind推Imagen2；ChatGPT Plus恢复订阅；OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么？

本周硅谷发生了什么？｜OpenAI遭纽约时报起诉；安卓版Copilot上线；英伟达推中国定制新显卡

近期资讯

抖音电商的三道“选择题”

30+被裁员，未必不是一件好事

Hinton发2024末日预警：10年内人类灭绝，奥特曼预言18个月ASI降临

2024年基金业绩排位赛：“冠军基”几乎无悬念

被围剿的巴奴能一路凶猛吗

回顾2024：AI和新硬件，开始改变我们的生活方式

英伟达2025祭出「迷你大脑」，雷神「Thor」剑指千亿机器人市场

“升职加薪我不要”，这届年轻人有点儿“叛逆”

2024 大模型年度五问：等不来GPT 5怎么过？

债券基金经理的路越走越窄

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响