海外仍在激辩人工智能的风险,中国终于迎来了本土大模型密集发布的超级周。
就在欧洲各国效仿意大利,考虑是否限制ChatGPT的节骨眼上,熊孩子又闯祸了,被曝出引用了不存在的新闻,还捏造了法学院教授性骚扰的故事。
只有印度明确提出不会立法,因为它事关国家战略。
人工智能的竞赛越来越激烈。中国在论文数量上占了优,但角逐的主力已经从学术界转移至工业界,在机器学习系统领域,中国与美国差距明显。流传在外的几份访谈纪要显示,中国科技巨头正视了这一差距,并想方设法追赶。
百度已经发布了文心一言,本周,华为、阿里等也纷纷拿出了自己的大模型应用。在接下来的一周,会有更多企业透露或发布旗下大模型。属于中国大厂的AI超级周正式开启,为全年奠定开局。我们也正式邀请您,加入“数字设计:AIGC创建者大会”,参与讨论。
以下是本周发生的足够有分量的几起AI大事件:
周一
各国调查ChatGPT,印度明确不立法
在意大利宣布暂时禁止ChatGPT后,法国与爱尔兰的隐私监管机构,已经与意大利的同行联系,以了解更多信息。德国也在考虑效仿意大利。西班牙则表示不排除未来展开调查的可能。除了喜欢监管互联网的欧洲,掀起此轮深度学习热潮的加拿大,也对ChatGPT 展开了调查,去年,该国提出了C-27法案,人工智能和数据法案(AIDA)是其中的重要组成部分。
本周,印度明确表示不打算引入立法来规范人工智能的增长,因为该行业对该国的创新、商业与战略的意义重大。
周二
中美人工智能竞赛,选手由学术界改为工业界
斯坦福发布了2023年人工智能指数报告。有几个现象值得关注:第一,发表论文最多的Top10机构,有9家来自中国,均为学术机构,堪称发论文机器;尽管中国发表的最多,但被引仍不及美国。第二,重要的机器学习系统,已经主要由工业界发布,其中,美国发布了16个,中国3个,美国的研究者数量大概是中国的6倍。第三,中美合作的论文数量虽然仍在增加,但增速已经是历年最低点。
发布了重要机器学习系统的国家
来源:斯坦福《2023年人工智能指数报告》
谷歌打算用新一代TPU暴力超车
谷歌公布了自家数据中心AI芯片TPUv4的细节。这款芯片早在2020年就获得部署,由其搭建的超算,性能较上一代提升了10倍;它比同期上市的英伟达A100,性能强1.7倍,能效提高1.9倍。谷歌暗示已经拥有与H100竞争的新一代TPU的生产线。
周三
Meta明确入局,交底商业化时间表
Meta已经组建了新的团队,聚焦生成式人工智能。Meta计划在庞大的广告机器中部署AI,并在年底前商业化。该公司还计划将其应用于所有产品中,包括Facebook和Instagram,并希望它能让元宇宙变得更好。
周四
多项工具发布,CV吃到NLP技术红利
谷歌发布了史上最大的ViT,220亿参数,这是基于Transformor架构的模型,让计算机视觉领域也吃到了自然语言处理的技术红利。
Meta则发布了“分割一切”的SAM模型(Segment Anything Model)。这个模型学会了什么叫物体,可以为任何图像或视频中的物体,甚至是训练中没见过的,都能将其与背景环境相分割区别。
本周,智源研究院也推出了自己的通用分割模型SegGPT。
周五
大佬疾呼GPT-5研发不能停
为马斯克捉刀的公开信,引发的争议仍在继续。大佬杨立昆与吴恩达连线直播,再次反对暂停更先进的AI的研发。杨立昆指责延缓研究和发展是一种腐朽倒退的思想。他支持监管产品,对反对监管研发。他以汽车产业为例反问,如果车都不存在,如何设计安全带?他认为目前行业将对OpenAI的封闭的不满,移情至对AI研发的现状上了。但随着其他企业更多模型的推出,这种封闭及其带来的优势不会持续太久。
从OpenAI叛逃的Anthropic,希望融资50亿美元
Anthropic计划在两年内融资50亿美元,让应用场景在数十个行业落地,以此与OpenAI展开竞争。该公司成立于2020年,创始人来自OpenAI。该公司正在开发名为Claude-Next 的“前沿模型”(frontier model),能力比如今最强大的人工智能还要强大十倍。谷歌是Anthropic的投资者之一。
阿里通义千问内测,中国大厂AI超级周开幕
ChatGPT激活了中国的科技巨头,让它们从TikTok与SHEIN等消费互联网本土创新优势中回过神来,重新一致向美国对齐。久违的一把手工程再现。
百度已经推出了文心一言,李彦宏有点不舍得公关团队删除了他“第一个发布”的表述。360股价坐在AI的风口上,周鸿祎离婚成为其中的点缀。更多的谜底正在揭晓。
阿里巴巴终于开启了通义千问的邀测。它是阿里巴巴旗下通义家族的一员。通义是阿里达摩院2022 年 9 月发布的大模型系列的名字。阿里云CTO周靖人回复媒体采访时称,通义千问时公司在探索基于多模态的大模型的路径上,或者说接近于多模态真正的趋近人类智慧体的路径上的一个节点,主要指它的对话形态。阿里巴巴很快还会继续测试另一款通义模型。
在他看来,如今的竞争不单单是模型本身的竞争,它既是研究又是工程,是从云的基础设施到AI算法再到数据处理的计算机科学的方方面面的竞争。
这与流传在外的几份访谈记录一致。在纪要中,来自阿里巴巴的受访对象承认,国内包括自己旗下的大模型,都没有达到GPT-3水平。核心瓶颈有三个,数据问题占三成,模型结构创新占四成,工程化能力占三成。
这还没考虑算力问题。国内大模型研发机构普遍缺少先进芯片,部分国内芯片厂商宣传不错,但至今无法提供样片测试。据浪潮估算,2023年中国科技巨头对AI服务器和芯片的需求将倍增。
华为也在本周更新了大模型的进展。华为云人工智能领域首席科学家田奇介绍,华为在2021年就立项盘古大模型,过去几年的AI项目已超100个,其中30%已渗入核心生产系统。
华为将大模型分为三层:L0,即基础模型,例如GPT3,它无法直接应用到行业场景中,需要与行业数据结合,训练出行业模型L1,部署在具体的应用场景中,由此得到细分场景模型L2。华为介绍了每个层级各自的落地情况,但没有透露2023年的最新进展。
据悉,字节跳动张一鸣近期大量阅读论文,筹谋着公司的重大战略方向。相对其他科技巨头,字节跳动入局大模型稍晚,今年初才正式组建专门的大模型团队。除负责最终项目落地的字节大模型外,负责中台的Data-AML(数据-应用机器学习)与负责学术研究的AI Lab都参与其中。三个团队分别位于新加坡、西雅图和北京。
根据其他企业的访谈纪要,字节跳动尽管启动稍慢,但得益于海量高质量的图片、视频数据,在多模态大模型上的未来不可小视。
下周,会有更多国产大模型的进展揭晓。4月10日,商汤科技或发布大模型;4月11日,阿里云峰会召开;4月14日,市场传言同花顺也将发布AI产品。
由上海经信委指导,特赞科技Tezign主办,未尽研究等联合主办的“数字设计:AIGC创建者大会“将于5月7日在上海召开,现已正式开放报名。
我们期盼更多人加入讨论,在人工智能大国竞争日趋激烈,全球化氛围渐行远去的当下,中国的创新创业该如何抓住这次机会。