欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
盘古大模型3.0今日发布
华为在华为开发者大会2023( Cloud )上正式发布盘古大模型3.0。盘古大模型将首次明确定位,即为行业而生”。古大模型3. 0 是一个面向行业的大模型系列,包括5+N+X三层架构,旨在重塑千行百业。这一系列的大模型将提供满足不同行业场景的多种技能。
国内大模型北京占一半
目前国内已有80多个大模型公开发布,其中约有一半来自北京。北京正在计划推出“算力券”政策,以支持中小企业在基于落地应用场景的情况下获取多样化、低成本的优质算力。
京东:旗下言犀大模型已写出30亿字营销文案
京东集团副总裁、探索研究院院长何晓冬表示,大模型将重塑所有商业模式,京东是人工智能发展的前沿阵地,拥有业界领先的AI技术能力。目前,京东旗下言犀大模型已写出30亿字营销文案,上万个直播脚本。
商汤与上海AI实验室等发布“书生通用大模型体系”
商汤科技与上海人工智能实验室等发布全新升级的“书生通用大模型体系”,包括:“书生·多模态”、“书生·浦语”和“书生·天际”三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。“书生·多模态”大模型无缝整合了语言、图像、视频等多种模态,包含200亿参数,使用80亿多模态样本训练。
WPS AI正式定名,官网同步上线
WPS AI官网(ai.wps.cn)同步上线,并开启招募智能办公体验官的通道,WPS Office个人用户和WPS365企业用户均可申请。
百度王海峰:文心大模型3.5的模型效果提升50%
百度首席技术官王海峰透露,截至目前飞桨已凝聚750万名开发者,这也是百度2023年以来首次对外披露飞桨生态最新数据。经过飞桨与文心大模型的协同优化,最新升级的文心大模型3.5的模型效果提升50%,训练速度提升2倍,推理速度提升30倍。
美图秀秀上线“AI扩图”功能
“AI扩图”功能正式在美图秀秀上线。“AI扩图”以AI技术为基础,支持原有图片的大面积生成,方便用户进行二次裁切与构图。在图像编辑和创作领域,该功能可大幅提高图片素材利用率、辅助艺术创意、革新传统图片算法。
B站内测“搜索AI助手”功能
B站内测“搜索AI助手”功能,体验该功能需要将哗哩哗哩app升级至7.36.0版本及以上,当在搜索框内搜索问句或在搜索词中输入'?即可体验新功能。
学而思推出基于自研大语言模型AIGC课程
学而思网校推出业内首个基于自研大语言模型的生成式人工智能(AIGC)课程——《人工智能第一课》,目前包含七个AI创作工具,以生成式AI技术创作“文、图、音”相结合的作品。
亿图脑图上线AI绘画功能 生成图片版权归用户
亿图脑图最近正式推出了AI绘画功能,并在海内外版本中实现了移动端、Web端和桌面端的全覆盖。亿图脑图的全新AI绘画功能提供了通用模型、二次元模型和图生图等多种绘画方式。
字节要造机器人,团队计划扩充到上百人
字节机器人团队已有约50人,计划年底扩充到上百人,并生产一些服务字节自己的电商履约需求,能在仓库里分拣、打包货物的机器人。
百度文心一言 App 上架苹果 App Store
百度文心一言在苹果的app store上架。此前文心一言APP已在安卓端开启内测。
李开复旗下大模型公司零一万物上线
李开复博士的亲自带领下,塔尖孵化的AI2.0公司零一万物正成为中国极有竞争力的大模型创业团队。零一万物总部注册于北京,面向全球招募顶尖人才。该公司采用自研大模型的路线,已经实现了百亿参数规模的内测,并计划将模型规模扩大至300到700亿参数,未来还计划推出开源的模型版本。通用大模型后,零一万物的下一步是推出结合图片、视频、3D的多模态模型。
消息称中国移动将发布“九天”1+N大模型
中国移动即将发布名为“九天”的1+N大模型,并计划将其应用于政务和客服两个主要的场景。目前,九天人工智能平台的技术团队拥有超过600名研发人员。
中国电信公布 TeleChat 大模型
中国电信集公布中国电信版ChatGPT产品 TeleChat大模型,该模型支持输出代码、写演讲稿等,其公司研发目标是打造万级AI算法舱,以成为百亿级AI服务商,产品涵盖AI算法、平台、应用、硬件、大模型等。
[国际要闻]
GPT-4 API向所有付费用户开放
GPT-4 API 现已向所有付费客户开放,并计划在六个月内淘汰Completions API中的旧模型,并鼓励用户使用Chat Completions API。此外,GPT-3.5 Turbo、DALL-E和Whisper API现已正式推出,预计今年晚些时候会为GPT- 4 和GPT-3.5 Turbo提供微调功能。 2024 年 1 月 4 日之前,使用基础GPT- 3 模型的应用将自动升级到更新的模型。
奔驰开始在生产中引入 ChatGPT
梅赛德斯-奔驰(Mercedes-Benz AG)目前正在生产中测试 ChatGPT,并与此同时加速了数字生产生态系统 MO360 中智能工具的应用。
分析师:AI可能推动微软估值达3万亿美元
Wedbush 分析师 Dan Ives 表示,到2024年初,微软将加入苹果的行列,估值达到3万亿美元。
2023「AI工作」谷歌搜索量是「加密货币工作」的4倍
根据 CoinGecko 的研究,2023年的「AI 工作」搜索量峰值几乎是「加密货币工作」的峰值搜索量的五倍,截至7月5日,仍高出四倍。
Mozilla 的生成式AI工具「AI Help」遭吐槽暂停使用
Mozilla 最近宣布了 AI Help,这是一个基于生成式人工智能的工具,旨在成为开发者在 MDN Web Docs 上寻找答案时的新「问题解决伴侣」。不过这个新的 AI 功能被吐槽是一个「极为糟糕的想法」,现在,AI Help 按钮已被暂停,暂时不再可用。
ChatGPT网站流量首次出现下降
SimilarWeb本周报告称,全球范围内访问OpenAI的ChatGPT网页的流量,包括桌面和移动流量,在6月份下降了9.7%。仅在美国,流量下降估计为10.3%。与此同时,全球独立访客数量下降了5.7%。SimilarWeb还指出,人们在该网页上停留的时间也下降了8.5%。据报道,这是自OpenAI八个月前推出ChatGPT以来,流量首次出现下降。
人工智能繁荣吸引加密矿机转向训练 AI 模型获利
加密货币矿工似乎正在经历一次复苏,这要归功于人工智能(AI)的繁荣。WSJ 一份报道指出,一些与加密业务相关的公司已经转向了人工智能领域。其中包括是 Satoshi Spain,曾经是加密挖矿设备的销售商,这些设备配备了用于 AI 应用的图形芯片。在加密货币的寒冬,这些机器没有市场需求,所以 Satoshi 开始将它们改造成用于 AI 的工具。
日本允许在学校内有限地使用ChatGPT等生成式AI
日本教育部发布了一项指导方针,允许在小学、中学和高中有限地使用生成式人工智能,如ChatGPT。
ChatGPT突然「断网」!OpenAI:别想白嫖付费内容
「联网」功能消除了ChatGPT与现实世界的「时差」,让它能浏览网上的实时内容来生成回答。怎么刚刚上线没多久,突然被OpenAI给下架了?可能原因是OpenAI要保护内容生产者的权益。
OpenAI撤销 ChatGPT Plus 与Bing的集成
OpenAI 撤销了 ChatGPT 与 Bing 的集成,因用户滥用该功能绕过付费墙获取文章。
微软bing聊天推出AI购物工具
微软宣布,新的微软购物工具在必应和Edge推出,Bing和Edge上的微软购物工具可以帮助找到最优惠的价格和购买时间,微软称,价格比较和价格历史是内置的浏览器功能,有助于确保在正确的地点和时间购买。
Valve禁止上架侵犯版权的AI游戏
有开发者表示,自己上传至Steam的游戏由于使用了AI生成的角色立绘,而被V社拒绝上架。V社回应称,他们并不想阻止开发商向Steam提交有AI生成内容的游戏,只是想确保开发者对其中使用的素材拥有相应的权利。
Part2热门产品
上交大团队推出首个胸部X-ray基础模型
上海交通大学发布了首个胸部X-ray基础模型,名为KAD(Knowledge-enhancedAutoDiagnosisModel)。该模型通过在大规模医学影像和放射报告数据上进行预训练,利用文本编码器将高质量医疗知识图谱进行隐空间嵌入,通过视觉-语言模型联合训练,实现了知识增强的表征学习。
医疗版ChatGPT:治疗方案与真人医生96%一致
MedGPT——基于Transformer的1000亿参数大模型,才刚问世一个月。目前在实际诊疗中,它已经具备多轮连续对话和多模态能力。而在未来规划中,MedGPT还会上线医疗版的PluginStore,预计将搭载1000+医疗应用,从表现来看,治疗方案与真人医生96%一致,想不到。
首个高质量「文生视频」模型Zeroscope,仅需8G显存就能用!
Huggingface上有作者发布了一个文生视频模型Zeroscope_v2,基于17亿参数量的ModelScope-text-to-video-synthesis模型进行二次开发。相比于原版本,Zeroscope生成的视频没有水印,并且流畅度和分辨率都得到了提升,适配16:9的宽高比。目标就是和Gen-2进行开源较量,即提高模型质量的同时,还能免费供大众使用。
Midjourney推出新功能Pan可沿指定方向扩充图片内容
Midjourney宣布推出了一项全新的内容扩展功能——Pan。这项功能旨在进一步丰富生成图片的内容,让用户获得更加丰富和多样化的图像体验。
北大团队发布中文法律大模型ChatLaw
北京大学团队最近发布了名为ChatLaw的中文法律大模型,旨在为大众提供普及性的法律服务。这个模型支持接收文件和语音输入,同时能够生成法律文书、提供法律建议以及为用户推荐合适的法律援助服务。
RunwayGen-2功能,提高生成视频画质
日前,Runway更新了AI视频编辑工具Gen-2功能,显着提高了生成视频的质量。对此有用户反馈,Gen-2的模型更新在生成的视频质量和稳定性方面有了很大的改进。
击败ChatGPT?OpenChat霸榜斯坦福AlpacaEval开源榜首
OpenLLM是一个在多样化且高质量的多轮对话数据集上进行微调的开源语言模型系列。其在斯坦福AlpacaEval上,以80.9%的胜率位列开源模型第一;在VicunaGPT-4评测中,性能则达到了ChatGPT的105.7%。只需要6K的GPT-4对话数据进行微调训练。
Part3观点
马斯克:中国将拥有强大的AI
马斯克称,中国在任何它想做的事情上都会完成得十分出色,这在许多领域都有体现,不论是经济还是人工智能领域。我相信,未来中国将拥有非常强大的人工智能能力。
调查:72%企业领导者计划在未来三年内采用生成式AI
研究表明,大多数来自财富500强企业的业务领导者(72%)计划在未来三年内将采用生成式AI,以提高员工生产力。然而,大约一半的受访者对这些技术的部署表示担忧。他们主要关注的问题是质量和控制(51%)以及安全和风险问题(49%)。
马斯克称全面自动驾驶或将在今年年末到来
马斯克预测,随着人工智能技术的快速发展,大约在今年年末,将会实现全面自动驾驶。他表示:“我之前也做过许多类似的预测,我承认之前的预测也不完全准确,但是这一次的预测,我觉得是比较接近的。”
亚马逊AWS副总裁:生成式AI不会一个模型统治市场
尽管科技界有一些知名人士担心人工智能(AI)带来的潜在生存威胁,但AWS产品副总裁MattWood并不是其中之一。Wood说:「自云计算的早期以来,我没有见过这种程度的客户参与和兴奋,这真是令人振奋的事情。」「我们不认为会有一个模型统治所有其他模型,所以我们希望能够提供模型选择。」
StabilityAICEO:五年内将不再有人类程序员
StabilityAI创始人兼首席执行官EmadMostaque做出了一个颇具争议性的预测:「五年内将不再有程序员。」Mostaque强调了他的公司致力于透明度,并坚信民主化获取AI技术的重要性。
Part4深度
《普通人用AI创作爆款内容指南》
普通人如何借AI创作爆款内容?如果没有方向,不妨先看看其他人的做法。本文通过对这些AIGC创作的观察,总结了几种现下流行的内容玩法包括:AI绘画花式整活、进阶版图灵测试、AI克隆人、AI剧情向视频等等。
ChatGPT摊上事了,遭索赔30亿美元!
16位匿名人士决定起诉微软和OpenAI,称这两家公司基于ChatGPT的AI产品在未获得同意或提供充分通知的情况下,收集并泄露了他们的个人信息,要求索赔30亿美元。
大模型冰火两重天?GPT访问增速大跌,国内产品热度也下滑,但一天N个发布
当下,大模型、AIGC到底是火还是不火了?让人摸不着头脑。一方面,有国内外的创业公司卖身、ChatGPT的访问量增速下滑、普通用户使用频次及关注度下滑;一方面,行业、大公司们动作频频,热火朝天。似乎,火了半年多的这个行业到了一个十字路口。
美团20.6亿收购光年之外,大模型创业是巨头游戏?8位一线从业者这样说
向8位业内一线玩家抛出以下问题,征集观点,希望为正在或即将进行AI创业的从业者提供参考。1.怎么看傅盛和朱啸虎的这次“辩论”,怎么看美团收购光年之外?2.怎么看“大模型创业是巨头的游戏”这一观点?个人或初创公司有哪些机会?3.怎么看国内AI大模型应用层的现状?