当前位置:首页|资讯|GPT-4|人工智能|苹果|OpenAI|微软

GPT-4近乎封神:是通用人工智能,又是通用技术,还迎来Apple Store时刻

作者:未尽研究发布时间:2023-03-26

这一周,GPT-4走向神坛,创造它的人试图为其加冕。

周一,OpenAI参与的论文发表,称GPT已是通用技术,80%的美国劳动力都受其影响,尤其是高收入的知识工作者。周三,微软参与的论文发表,称刚发布的GPT-4,已经可以视为通用人工智能(AGI)的早期版本。

周二,英伟达在自己的发布会上,数次赞叹生成式AI迎来了“iPhone时刻”。周四,OpenAI将ChatGPT连接到互联网,又让人们高呼“App Store时刻”的来临。

很多人相信微软将成功挑战谷歌、苹果、亚马逊,以及其他一众垂直领域的SaaS厂商。但本周,微软的竞争对手们也纷纷展开反击。

泡沫涌动,部分谨慎的创业者、投资者与监管机构开始审视人工智能带来的风险。

以下是本周最关键的几起AI大事件。

周一

美国的几位经济学家携手OpenAI,发表了一篇关于大型语言模型对劳动力市场潜在的影响的论文,也就是OpenAI的GPT。

论文的结论令人震撼:大约80%的美国劳动力至少有10%的工作任务会受到影响;19%的员工至少50%的工作任务受到影响。高收入工作可能面临更大的暴露风险,白领与知识专家面临极大挑战。

既然影响如此之广,OpenAI干脆称GPT( Generative Pre-Trained Transformer)简直就是通用技术(General Purpose Technology)。历史上的通用技术,如印刷术、蒸汽机,无论是商业尺度、空间尺度还是时间尺度,都影响深远,甚至通过生产力的提升,重构生产关系。

Runway发布新的视频AI工具

生成式AI创新向视频领域深化。人工智能初创企业Runway宣布了一款新的文本生成视频(Text-to-video)AI 模型,名为 Gen-2。用户输入一个描述,然后自动生成指定风格的对应视频。

上周末,谷歌发布的Vid2Seq,能大规模地对未标记的叙述视频进行有效预训练,降低了训练成本。

此外,当日,微软及其子公司还面向医疗机构,推出了将口语问诊生成文本记录的生成式AI应用,旨在减少医生的倦怠感。

周二

在一年一度的发布会上,英伟达发布了AI超级计算服务DGX Cloud,还提供NVIDIA AI Foundations的服务,加速企业创建自己的大模型,主要为文本生成、视觉语言、生命科学等三大领域的AI厂商代工。

这让那些渴望算力但又无法独自承担模型端到端开发成本的企业松了一口气。英伟达也借此更深度地围绕AI搭建自己的生态。

同时,英伟达还推出了3款全新推理GPU,分别擅长AI视频设计、图像生成和ChatGPT等大型语言模型的加速。公司还证实已为中国提供特供版“H800”,尽管它的性能不如H100。

谷歌开放Bard服务

谷歌开放了对美国和英国用户的聊天机器人Bard的访问权限。谷歌已经准备好第二次正面迎击微软。上次,Bard的演示出了点小问题。

谷歌变得更为谨慎。在推出Bard的方式上,谷歌选择了和微软截然不同的路径。Bard并未被嵌入搜索引擎中,而是作为独立的页面存在,谷歌强调它是“搜索的补充体验”。这或许是为了避免其搜索引擎广告业务受到威胁。

谷歌称,将继续改进Bard,添加编码、多种语言和多模态体验等功能,向更多国家或地区的用户开放。

微软必应接入文生图功能

微软趁胜追击,将AI图像生成功能ImageCreator引入新版必应和Edge浏览器,面向公众免费开放。这是一款帮助用户使用自然语言描述来生成AI图像的产品,搭载在OpenAI提供的文生图大模型DALL-E上。

Adobe推出创意AI工具Firefly

在平面设计师与艺术家抛弃自己前,设计工具巨头Adobe终于推出名Firefly的创意生成式AI。它将直接整合至Experience Manager、Photoshop和Illustrator三个现有应用中。这能使得AI真正整合到平面设计的工作流程里。

Adobe也在尝试解决版权与透明度问题。这是生成式AI备受关注的风险地带。Firefly的训练数据来自公开许可内容和版权已过期的公域内容等。同时,它生成的图片将包含标签凭证,声明其是人工智能生成的。

周二属于人工智能,它向各行各业渗透。当日,育碧与Roblox双双推出了其游戏领域的生成式AI工具。生物技术初创企业Unlearn融资1500万美元,为临床试验生成监管批准的患者“数字孪生”档案,降低医药研发成本。

同日,为英特尔开发GPU的首席架构师离职,称自己创业开发AI工具,会支持RISC-V 等开源技术制造的芯片,这才能让AI正在大众化。目前,AI计算被英伟达所统治。

周三

通用人工智能的火花:GPT-4 的早期实验

微软上传了一份评估GPT-4的论文,称这个模型在一系列领域的智能,已经远远超过最初发布的ChatGPT,可以视为通用人工智能(AGI)的早期版本,尽管仍不完整。消息一出,引发轩然大波。

这项研究发现,除了精通语言,GPT-4还能无需特别提示,解决数学、编程、视觉、医学、法律、心理和更多领域的新任务和难任务。它还通过了亚马逊模拟面试,成绩超越所有人类。

GitHub 开放面向GPT-4的编程

GitHub 宣布了 CopilotX 计划,正式接入 GPT-4,新增了聊天和语音功能,允许开发人员用自然语言询问如何完成特定的编码功能。GitHub Copilot目前已编写了该平台上 46% 的代码,帮助开发人员将编码速度提高了 55%。

周三,是大家忍俊不禁与面容严肃共存的一天。特朗普被捕的AI伪作到处传播,Midjourney拒绝为原作者服务;中国互联网广泛传播Midjourney画的一对情侣。很多历史学家喜欢“图像证史”,他们未来会很苦恼。

当日,OpenAI偷偷修复了用户隐私BUG。这始终是个大问题。同日,Firefox浏览器背后的非营利组织Mozilla,投资3000万美元,成立了Mozilla.ai,它部分是研究公司,部分是社区,使命正是构建开源和“值得信赖的”人工智能。这是一个趋势。本月初,多家人工智能企业资助成立了EleutherAI研究所。

周四

OpenAI将ChatGPT连接到互联网

OpenAI 发布 ChatGPTPlugins (插件集),它能将 ChatGPT 连接到第三方应用程序。这被视为AI 的“App Store时刻”,AI 经历了“iPhone时刻”后,如今也有了应用商店。

许多早期合作者已加入其中,包括Expedia、FiscalNote、Instacart、Kayak、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier等。

OpenAI承认,联网后的ChatGPT,不良行为可能会加剧,例如发送欺诈和垃圾邮件等。

埃森哲裁员2万人,知识工作者集体下岗开始了?

IT外包和咨询巨头埃森哲宣布裁员1.9万人,占员工总数的2.5%。这主要是经济衰退的结果。在人工智能改变知识工作的背景下,埃森哲表示将“专注于执行压缩转型”,给了更多的解读空间。

上个月,咨询公司贝恩刚宣布与OpenAI合作,利用人工智能提升客户商业潜力。

周四,监管引发关注的一天。人工智能正在适应人类的提示,人类社会也在适应人工智能的无处不在。拥有200万用户的Replika,决定阻止AI色情内容,因为投资者和监管机构不喜欢这种“恶习”,意大利已经禁止了它。法国则批准了在2024年奥运会上使用人工智能辅助监控,保障游客安全的法案。

当日,Character.AI融资1.5亿美元,成立16个月,估值达到了10亿美元,a16z领投。人们猜测它可能将探索如何将AI与Web3联系起来。

周五

微软威胁切断竞争对手访问权限

微软发现自己被人赚了便宜。该公司声称,若竞争对手将必应的搜索索引作为自家AI聊天产品的基础,微软将阻止它们获取相关数据。微软已告知至少两个客户,它们的行为违反了合同条款。

微软目前与未来的主要竞争优势,就构建在GPT之上。它有足够的理由担忧。从2月到3月,必应的下载量在全球增长了八倍,访问量增长了16%。但同样,人们批评这将人工智能导向更封闭与垄断的未来。

又一个开源大模型,比ChatGPT还好?

大数据独角兽企业Databricks公开了大模型Dolly。它只有60亿参数,自称效果堪比ChatGPT。不过该公司还没有发布正式的基准测试。Databricks目前估值比OpenAI还要高近百亿美元。

开源精神仍然有其拥趸,此前,斯坦福大学也开源了自己的Alpaca模型。

我们期待新的一周,AI在越来越明确的风险控制下,展示其更为惊人的创造力。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1