欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
1.《生成式人工智能服务管理暂行办法》发布
《生成式人工智能服务管理暂行办法》于2023年8月15日起施行。办法提出了生成式人工智能服务的总体要求,包括坚持发展和安全并重、促进创新和依法治理相结合的原则。办法还明确了生成式人工智能服务的技术发展和治理方面的措施,包括鼓励创新应用、推动基础技术自主创新、提高训练数据质量等。
2.中科院ChipGPT攻克AI芯片设计 代码量减少近10倍
中科院计算所的 ChipGPT项目引起了人们的关注,ChipGPT 的者指出,与传统的敏捷方法相比,使用大语言模型的芯片自动设计方法可以减少代码量5.32-9.25倍,并且在面积优化方面取得了47% 的提升。这意味着利用大语言模型可以显著加速芯片开发,并且可以实现设计的优化。
3.京东推出言犀大模型 预计8月上线
京东正式推出京东言犀大模型,同时发布言犀AI开发计算平台。该平台已经启动预约注册,预计8月正式上线。
4.机器人接入大模型无需训练即可完成复杂指令
李飞飞团队的最新成果是一项名为 VoxPoser 的具身智能技术,可以使机器人直接听懂人类的自然语言指令并完成复杂任务,无需额外的数据和训练。
5.快手搜索内测智能问答产品
快手方面透露,他们目前正在进行智能问答产品的内测,为用户在搜索场景中提供智能问答和文本创作等新功能。这是短视频直播行业首个基于大语言模型的应用产品。
6.AIGC半年融资超1000亿
仅在2023年上半年,涉及生成式AI大模型及其落地应用的企业的融资就有51笔,投融资金额超过人民币1000亿元。其中,单笔过亿元融资就有18笔。
7.北京将发4000万元算力券 支持大模型企业
北京市经济和信息化局计划通过算力券等形式,支持模型伙伴和模型观察员,以降低企业的训练成本并提高算力的匹配效率。首期的算力券预计将资助不低于4000万元的模型伙伴企业。
8.蓝色光标:出海广告主AI营销工具初代模型将于下半年推出
蓝色光标在互动平台表示,蓝色光标针对出海广告主的AI营销工具(垂直行业模型)初代模型将于下半年推出并试运行。
9.中科创达与北京智源人工智能研究院成立AI大模型实验室
中科创达宣布与北京智源人工智能研究院共同成立”魔方未来联合实验室“。基于该实验室,双方将在大模型开发与应用创新等方面展开战略合作,通过优势资源共享与互补,共同推进大模型技术创新与成果转化,促进人工智能技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。
[国际要闻]
1.谷歌更新Bard功能:支持中文对话、朗读内容
谷歌的 AI 聊天机器人 Bard 更新了一些新功能,包括支持40种新语言和能够朗读内容的能力。用户现在可以用阿拉伯语、中文、德语、印地语和西班牙语等近四十种语言与 AI 进行对话。Bard 还增加了固定和重命名对话的选项,并具有丰富的控制选项和多模态功能。这些改进提升了 Bard 在语言能力、语音回应、控制选项和多模态功能等方面的表现。
2.马斯克成立AI公司 xAI
马斯克在推特上宣布,他的人工智能公司 x.AI 正式成立,目标是理解“宇宙的真实本质”。xAI 与推特当前母公司X公司(在架构上)相互独立,但将与X公司及特斯拉密切合作。这家公司的高管团队将由马斯克带领,成员来自曾工作于 Google、DeepMind、微软、特斯拉等公司的高管,曾负责 AlphaCode、ChatGPT 等项目。
3.Meta 即将发布商用版 LLaMA 大模型
Meta 即将发布其人工智能模型的商业版本,使初创企业和企业能够在该技术基础上构建定制软件。Meta 表示其 LLMs 是「开源」的,这意味着新模型的细节将公开发布。
4.Adobe Firefly Web 服务现已在全球推出
Adobe 今天宣布其 Firefly Web 服务现已在全球推出,支持100种语言的文本提示。除了扩大访问范围,该公司还表示,Firefly 在网络和 Photoshop 上已经生成了超过10亿个资源。该公司称这些发布是「Adobe 历史上最成功的两个测试版本之一」。
5.OpenAI 最新模型 GPT-4架构曝光
GPT-4的所有细节揭示,包括 GPT-4的架构、训练和推理的基础设施、参数量、训练数据集、token 数、成本、混合专家模型(Mixture of Experts,MoE)等非常具体的参数和信息。
6.Netflix开发新的AI技术实时替换视频背景
Netflix的研究人员表示,他们可能已经让无处不在的绿幕过时了。Maganta Green Screen (MGS)是一项在影视行业中应用人工智能的创新进展,它利用人工智能的力量增强视觉效果,使其在实时中更加逼真和精确。
7.特斯拉人形机器人Optimus入驻北美门店
特斯拉将其最新的人形机器人Optimus擎天柱的模型引入了北美门店,为消费者带来了一个全新的科技体验。此次门店中展示的机器人并不能真正的运行,只是为了展示公司未来的美好愿景,希望借助人们对机器人的好奇心,进一步提升其汽车产品的关注度。
8.AI检测工具容易误判非英语写作为机器生成
一项研究显示,超过一半的时间里,AI检测器错误地将非英语母语者的写作判断为机器生成。这种错误分类可能对求职者、学生和其他经常根据写作能力评估的人造成困扰。
9.今年 AI 服务器出货量年增率达70%
最新报告指出,由于来自美国超大云端服务供应商的订单增加,特别是微软,再加上沙特阿拉伯新增的人工智能(AI)需求,因此调高今年 AI 服务器出货量年增率上看70%。
10.谷歌被指控窃取数百万用户数据训练人工智能工具
谷歌面临一项广泛的侵权诉讼,指控这家科技巨头未经用户同意,窃取了数百万用户的数据,并违反版权法来训练和开发其人工智能产品。
11.OpenAI被知名作家起诉侵犯版权
据外媒报道,美国喜剧演员兼作家Sarah Silverman以及作家Christopher Golden和Richard Kadrey近日在美国地方法院起诉OpenAI和Meta ,指控其侵犯版权。他们称,OpenAI和Meta使用了他们的书籍作为训练数据,而没有得到他们的同意。
12.Edge 浏览器内的 Bing Chat 将具备聊天记录功能
微软广告和网络服务首席执行官 Mikhail Parakhin 在回答网友的提问时表示,微软 Edge 浏览器内的 Bing Chat 将支持聊天记录功能。
13.微软必应吸引近15亿用户使用 Bing AI
Bing AI 是当今最受认可的人工智能工具之一,与 ChatGPT 的受欢迎程度不相上下。根据最新的统计数据,仅在2023年,就有近15亿用户访问了 Bing,而这一年还远未结束。
14.YouTube推出AI生成的测验功能
YouTube正在其移动应用程序上尝试使用人工智能生成的测验,旨在帮助观众更多了解教育视频中涉及的主题。该功能还将帮助视频分享平台更好地了解每个视频对某一主题的覆盖程度。这一AI生成的测验功能已经全球范围内向部分观看教育视频的用户推出。
Part2产品
1.商汤绘画大模型 RAPHAEL 出手即大作
商汤大模型团队提出的文生图大模型 RAPHAEL,可以生成具有高度艺术风格或者摄影风格的图片,速度极快。RAPHAEL 通过 Space-MoE、Time-MoE 和 Edge-supervised learning 三个组件实现。
2.谷歌新插件推理效率比ControlNet高20倍以上
谷歌最近发布了 MediaPipe Diffusion 插件,这是一个可在移动设备上运行的低成本可控文本到图像生成解决方案。该插件可以提取条件图像中的特征,并将其注入到扩散模型的编码器中,以实现对图像生成过程的控制。与 ControlNet 相比,MediaPipe Diffusion 插件的推理效率提高了20+ 倍,在 v100上运行甚至可以提速高达100倍。
3.上海交大发布开源“白玉兰科学大模型”
上海交通大学在2023世界人工智能大会上发布了“白玉兰科学大模型1.0版”。“白玉兰科学大模型1.0版”包括三个领域模型,其中化学合成(BAI-Chem)代表了以分子结构为中心的学科方向,神经流体(BAI-NeuroFluid)代表了以动力学为中心的学科方向,科学评测基准(BAI-SciEval)是一个跨学科、跨模态的基础模型。
4.清华&中国气象局大模型登Natur 精确预测极端天气
清华大学与中国气象局合作开发的大模型「NowcastNet」成功解决了极端降水天气临近预报的世界级难题。该模型能够在公里尺度下预报0-3小时的极端降水,包括短时强降水、暴风雨、暴雪、冰雹等。
5.百川开源最强中英文百亿参数模型!超越LLaMA
百川智能正式发布了参数量130亿的通用大语言模型 Baichuan-13B、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本,成为中国开源大模型领域的重要里程碑。
6.文生视频 AI Pika Labs:做广告、电影都不在话下
一款名为 Pika Labs 的文生视频 AI火了。该 AI 能够生成非常流畅的视频,甚至可以用于广告和电影制作。从Pika Labs生成的一些视频片段来看,整体的表现十分出色。Pika Labs 的 AI 在时间一致性和转场方面表现出色,生成的视频效果非常流畅。
7.ChatGPT上线GPT-4以来最强应用“代码解释器”
OpenAI 为其语言模型 ChatGPT 引入了一项名为“代码解释器”的新功能。该功能可以让用户拥有更好的交互编程体验和强大的数据可视化能力。用户可以在其 ChatGPT 配置文件中启用代码解释器选项,并将其用于数据分析、图表创建、文件编辑和数学计算等任务。代码解释器被认为是 OpenAI GPT-4最强大的功能之一。
8.ChatGPT神器Code Interpreter终于开放
OpenAI 已正式推出 Code Interpreter,这是其针对 ChatGPT Plus 用户的官方插件。Code Interpreter 允许用户直接在 ChatGPT 界面中编写和执行 Python 代码,从而实现数据分析、创建图表、编辑文件等任务。这项新功能受到了早期采用者的好评,他们称赞其实用性和自动执行复杂任务的能力。Code Interpreter 通过提供用于用代码解决问题的通用工具箱并将大型语言模型集成到 AI 工作流程中,解决了 ChatGPT 早期版本的局限性。
Part3观点
1.AMD CEO:人工智能将主导芯片设计行业
AMD 首席执行官苏姿丰强调,AI 是芯片设计的方式,尤其是在测试和验证方面,并将 AI 确定为未来的首要战略重点。
2.斯坦福大学:大多数大语言模型不符合欧盟AI法案
斯坦福大学著名的以人为中心的人工智能研究所 (HAI) 表示,对10个主要基础模型的调查显示,它们“基本上不”遵守欧盟的人工智能法案。得分最高的基础模型是Bloom。紧随其后的是 EleutherAI 的GPT-NeoX和 Google 的PaLM2。OpenAI 的 GPT-4排名第四,Cohere 的Command跻身前五。
3.报告称:高技能工作岗位更容易受到AI影响
报告显示,高技能职业可能最易受人工智能(AI)影响,当然AI当前对就业的影响尚未完全显现。研究进一步将"高技能白领工作"定义为最易受AI影响的职业,包括:商务专业人员、经理、首席执行官和科学工程专业人员被列为最主要受AI能力影响的职业。
4.比尔·盖茨:人类已准备好应对人工智能带来的重大风险
比尔盖茨表示,人类已经准备好处理人工智能带来的重大风险。尽管他无法回答人工智能可能导致的灭绝威胁,但他对能够应对人工智能带来的风险持乐观态度。
5.腾讯张立军:游戏已成为推动芯片、AI等技术发展的强大驱动力
腾讯公司副总裁、华东总部总经理张立军表示,在过去半个多世纪里,游戏与前沿科技一直处于一种紧密的共生关系之中。在用户不断提升的体验需求驱动下,游戏总能及时地拥抱和应用最前沿的科技成果,反过来,游戏也成为推动芯片、AI 等技术发展的强大驱动力。
6.迪士尼米奇配音演员:AI永远无法捕捉米奇老鼠的精髓
AI是当今好莱坞正在关注的一个话题,推动人工智能的技术确实很了不起,但根据迪士尼吉祥物米老鼠的配音演员艾万的观点,它永远无法捕捉米奇老鼠的精髓。艾万表示:“天哪,我得说,当然有许多令人惊叹的AI技术正在发展,非常令人印象深刻。但是我不认为任何东西能够取代角色的核心。”
Part4深度
1.GPT-4被曝“变蠢” OpenAI 偷偷搞“小动作”?
近期,有用户在 OpenAI 的在线开发者论坛中反映,GPT-4的质量似乎有所下降,变得更 “蠢” 了。用户指出,GPT-4在长篇内容的分析和创作上退步明显,并且写作质量下降。一些开发者也表示,GPT-4在逻辑能力、编码能力等方面都出现了问题,出现了循环输出代码、错误响应等情况。有专家猜测,OpenAI 可能在创建一些较小的 GPT-4模型,这些模型类似于大型模型,但运行成本较低。
2.AI「入侵」内容平台,创作者狂喜?
AI 在内容平台上的大规模应用。知乎、百家号、网易号等平台都推出了 AI 辅助创作的功能,包括 AI 笔记、AI 大纲、AI 标题等。这些 AI 工具能够帮助创作者提高创作效率,扩大内容池。然而,AIGC 的泛滥也带来了一些风险,如内容质量的下降和对人工创作者的冲击。平台和创作者都需要借助 AI 的力量不断学习和进步,以适应这个时代的变化。
3.大模型加速涌向移动端!ControlNet手机出图只需12秒
随着大模型技术的发展,移动应用的人机交互方式正发生革命性变化。高通公司在 CVPR2023上展示了搭载15亿参数的 ControlNet 模型在手机端的运行,仅需不到12秒就能完成出图。高通 AI 负责人 Ziad Asghar 表示,将10亿 + 参数的大模型部署到手机只需要不到一个月的时间。大模型的出现将使终端设备上的数字助手能够通过自然语言指令完成各种操作,实现个性化的用户体验。通过量化、编译和硬件加速优化等技术,大模型在终端侧的部署变得更加容易。这一变革不仅限于手机,而是将重塑包括笔记本电脑、汽车、物联网等终端设备上的所有移动应用。高通将领导这场变革,并成为推动大模型落地的核心。
4.ChatGPT最强竞品Claude2重磅升级 第一手实测在此
Anthropic 发布了 Claude2,被称为 GPT-4最强竞品,免费且不需要排队即可使用。用户可以通过邮箱注册登录,并享受比 GPT-4便宜4-5倍的价格。Claude2支持上传和分析长文档,可以提取摘要并回答相关问题。用户可以构建自己的知识库,实现更高效的学习和研究。此外,Claude2还有代码解释器和小学数学能力,对于程序员和学生来说非常实用。
5.ChatGPT潮落 资金逃离AI概念股
ChatGPT 的受欢迎程度正在下降,网站流量出现负增长。受欢迎程度的下降也对股市产生了影响,许多人工智能概念股都出现了大幅下跌。然而,有迹象表明大型语言模型正在转向 B2B 市场,OpenAI 开放了 GPT-4API,百度和阿里巴巴等其他公司专注于为 B2B 应用程序开发大型模型。尽管 ChatGPT 的受欢迎程度有所下降,但更多杀手级应用程序正在开发中。
6.更具情感的大模型,会给人类带来什么?
文章讨论了人工智能开发中对情商 (EQ) 的日益关注及其潜在应用。它提到了诸如Character.ai和Inflection AI的Pi之类的例子,它们优先考虑EQ以提供与用户更加个性化和同理心的互动。文章强调了情感人工智能的独特优势,包括其理解人类情感和社交互动的能力。像 Westlake Mindworks 这样的公司,这些公司正在致力于开发具有长期记忆和高级情绪分析功能的人工智能。