欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
1.腾讯音乐推出AI社交APP“未伴”
腾讯音乐旗下一款名为“未伴”的AI社交APP在近期开启测试。未伴是一个集AI陪聊、AI伴侣写真等多个功能于一体的AI聊天产品。进入产品首页后,用户需要选择一个AI伴侣,也可以由自己来创造。
2.联想与百度“文心一格”达成AIGC合作
联想与百度在AIGC领域达成深度合作,推出ICT首家AI定制服务。联想官网私人定制业务全面引入百度文心一格,消费者可通过官网AIGC主题绘画活动定制笔记本电脑外观。
3.WPS AI全新升级
WPS 办公软件宣布推出全新的AI功能。包括 WPS AI 智能助手、全新的组件功能、更新的视觉设计和协作功能。
4.汤姆猫:AI产品已初步实现AI识物、AI绘图、对话等功能
汤姆猫表示,借助国内合作方的多模态通用大模型,公司国内团队打造的AI产品持续在完善视觉能力、对话能力及情感感知能力,目前已初步实现AI识物、AI绘图、情景对话、英语口语启蒙等功能。公司将于近期开展产品的封闭式测试。
5.2023年上半年AI应用下载量同比增长114% 突破3亿次
报告显示,随着ChatGPT和Stable Diffusion等AI算法的更新迭代,全球AI市场快速升温。2023年上半年,AI应用下载量同比增长114%,突破3亿次,超出2022年全年水平。与此同时,AI应用内购收入同比激增175%,逼近4亿美元。
6.华为发布全球首个商用能源行业 AI 大模型
华为联合山东能源集团宣布华为盘古大模型在矿山领域实现了首次商用,解决了人工智能在矿山领域落地难的问题,引领矿山 AI 开发模式从作坊式向工厂式转变,为 AI 大规模进入矿山打下坚实基础。
7.美团申请美团光年商标
美团关联公司申请注册多个「美团光年」「美团光象」商标,国际分类为教育娱乐、广告销售、科学仪器等。此外,美团已完成对大模型创业公司光年之外境内100% 股权的收购。
8.华为盘古大模型能源领域首次商用 盘古矿山大模型发布
山东能源集团、华为、云鼎科技联手发布全球首个商用于能源行业的AI大模型——盘古矿山大模型,,前期试点验证AI大模型赋能工业生产领域的基础上,正在开发和实施首批场景应用。
9.贾扬清新公司Lepton AI曝光
贾扬清的新公司名为 Lepton AI,联合创始成员包括 ONNX 的联创和 etcd 的作者等人。Lepton AI 的目标是建立高效的 AI 应用平台,他们的产品正在内测中。
10.广电运通发布“望道”行业大模型
广电运通发布aiCore System V3.0和“望道”行业大模型。“望道”行业大模型,具备多维知识引入、多级开发范式、中文能力增强、行业能力增强四大技术特点。
11.华为推出大模型时代AI存储新品
华为公司推出新型的OceanStor A310深度学习数据湖存储系统以及FusionCube A3000训练/推理超融合一体机产品。这两款产品均具有较高的技术含量,可在多个场景中为用户提供一站式的便捷服务,针对基础模型训练、行业模型训练以及细分场景模型训练推理等多个方面提供全面支持。
12.工信部:数据治理再到人工智能、 模型训练的算力产业链条
工信部信息通信发展司司长谢存介绍表示,着力构建数据产业生态,充分发挥中卫数据中心集群集聚效应,加快打造从服务器、网络设备到数据加工、数据治理再到人工智能、 模型训练的算力产业链条。
13.罗永浩直播间招AI科学家中签率千分之一
罗永浩淘宝直播间上架了一项特殊商品,即AI算法科学家职位。网友们可以直接在直播间中上传他们的简历申请该职位。这个岗位也十分受欢迎,已经收到了1000多份简历,其中就包括来自“清华北大复交常青藤”的优秀人才。由于竞争相当激烈,中签率只有千分之一不到。
[国际要闻]
1.谷歌为新闻出版商开发一种人工智能工具
谷歌正在开发一种人工智能工具,用于为新闻出版商生成文章正文和标题,该公司表示,这突显了这项技术可能很快改变新闻业的方式。
2.苹果正在开发AI产品“AppleGPT”
苹果内部正在研发类似于 OpenAI 的 ChatGPT 和谷歌的 Bard 的人工智能(AI)产品“Apple GPT”。苹果正在测试生成式 AI 工具可以生成文本,回答用户的问题,并进行自然对话。这将为苹果的 Siri 和其他 AI 助手提供更强大的语言理解和生成能力。
3.OpenAI放宽GPT-4对话次数限制
OpenAI宣布将放宽对ChatGPT Plus用户的使用限制,这意味着用户可以与ChatGPT进行更多的对话。从下周开始,ChatGPT Plus用户每3个小时可以与GPT-4进行50轮对话,相较于之前的25轮对话,用户的体验将会得到提升。
4.ChatGPT推出自定义指令功能
OpenAI为ChatGPT添加了一个名为Custom instructions的新功能,允许用户在系统级别上为聊天机器人定制化一些指令,使机器人更加个性化,并更好地满足用户的需求。避免了用户每次开启新的聊天时都需要对ChatGPT进行调教。
5.随着时间的推移GPT-4变得越来越笨
在经过三个月的评估后,ChatGPT 的性能在某些任务上明显恶化。例如,在判断质数和显示思考过程的任务中,GPT-4的准确率下降了95.2%,而 GPT-3.5的准确度大幅上升,提升了79.4%,从7.4%提高到了86.8%。
6.OpenAI斥资500万美元用AI技术辅助地方新闻事业
OpenAI 与美国新闻项目(AJP)合作,向 AJP 提供500万美元的资金支持,以利用 AI 技术辅助地方新闻事业。
7.微软、OpenAI等公司已使用合成数据来训练AI模型
人工智能初创公司Cohere首席执行官AidenGomez表示,由于Reddit、推特等公司的数据采集要价太高,微软、OpenAI和Cohere等公司,已使用合成数据来训练AI模型。Gomez表示,合成数据可以适用于很多训练场景,只是目前尚未全面推广。
8.微软发布企业版Bing Chat 为企业用户解决隐私和安全担忧
微软发布了面向企业的 AI 聊天工具 Bing Chat Enterprise,该工具可满足对生成式 AI 工具存在隐私和安全担忧的企业需求。Bing Chat Enterprise 今天开始提供预览版,并将免费包含在特定的 Microsoft365订阅计划中。该服务可以在支持 Bing Chat 的任何位置访问,包括 Bing.com/chat 和 Microsoft Edge 侧边栏。
9.微软Office AI工具定价每人每月30美元
微软披露面向 Office365E3、E5、商业标准版和商业进阶版的订阅商户,Microsoft365Copilot 将统一定价为每个用户每月30美元。对于注册用户而言,新功能将使企业级版本的 Microsoft365服务的月平均费用大幅增加53% 至83%。
10.微软公布辅助模型 ICAE,可压缩大语言模型上下文
微软近日发布论文,介绍一款名为 In-context Autoencoder (ICAE)的模型,可用于在大语言模型中进行上下文压缩。论文显示, ICAE 中包含两个模块,一个可学习的编码器通过从 LLM 中采用 LoRA 进行调整,将长上下文压缩成有限数量的存储槽。还有一个固定解码器,可以根据存储槽进行各种目的的条件选择。
11.AI聊天模型消耗的水量惊人
一位专家表示,向 AI 聊天机器人提出25个问题时,大约会消耗半升水,AI 聊天机器人除了消耗水之外,还会向环境排放大量二氧化碳。
12.WormGPT :黑客版ChatGPT 没有道德界限或限制
WormGPT,是一个专为协助网络犯罪分子设计的聊天机器人。根据 SlashNext 的说法,WormGPT 的开发者正在一个热门的黑客论坛上销售该程序的访问权限。该公司在一篇博文中表示:「我们注意到恶意行为者现在正在创建类似 ChatGPT 的自定义模块,但更容易用于邪恶目的。」
13.DeepMind 推出 NaViT 模型 可显著减少训练时间
Google DeepMind 推出了 NaViT:一种新的 ViT 模型,它在训练过程中使用序列打包来处理任意分辨率和宽高比的输入。该模型将图像分割成小块,并线性投影到token上,形成了这个模型的基础。
Part2产品
1.MosaicML推开源大语言模型MPT-7B-8K 上下文长度达8k
MosaicML 发布了名为 MPT-7B-8K 的7B 参数开源语言模型(LLM),支持8K 的上下文长度。与以前的模型相比,MPT-7B-8K LLM 在摘要和回答任务方面展现出卓越的能力。
2.浙江大学发表 TableGPT,可对表格进行操控
据 Huggingface 页面显示,浙江大学研究团队推出一款针对表格进行操控的大模型产品 TableGPT。 TableGPT 是一个统一的微调框架,使模型能够使用外部功能命令来理解和操作表格。TableGPT 中引入了与表格交互的能力,可实现问题解答、数据操作、可视化生成分析报告等功能。
3.开源工具xTuring:三行代码就能创建自己的大语言模型
xTuring 是一个开源工具,可以让用户只用三行代码就能创建自己的大语言模型 (LLMs)。xTuring 可以适应不同的硬件配置,通过内存高效的微调技术 LoRA,加快学习过程,降低硬件成本。据称,xTuring 使用 LoRA 等内存高效微调技术来加速学习过程,并将硬件支出减少多达90%。通过减少微调所需的内存量,LoRA 有助于更快速、更有效的模型训练。
4.阿里达摩院推大语言模型PolyLM:通晓18种语言
阿里巴巴达摩院发布的一个名为 POLYLM 通晓18种语言的大语言模型,该模型可以应用于对话问答、文本生成、机器翻译和情感分析等领域,能够自动生成高质量的多语言文本,从而为跨语言、文化的交流提供便利。,该模型拥有1.7B和13B两种参数版本可选。
5.LLM 微调神器 Lamini:免费且迅速的微调工具
斯坦福开发者发布了 LLM 微调工具 Lamini,该工具被称为能为每个开发人员提供从 GPT-3到 ChatGPT 的超能力。Lamini 推出了全新的 Alpha 公测版,通过简洁的代码和快速的速度,让微调变得更加容易。目前,4亿参数以内的 LLM 微调完全免费,这标志着 LLM 微调的开始。
6.Meta开源免费可商用大语言模型Llama2
Meta 发布免费可商用版本 Llama2,Llama2包含了70亿、130亿和700亿参数的三个版本模型。其微调模型接受了超过100万个人类注释训练。在 Benchmarks 基准测试中,Llama2的表现优于其他开源模型。
模型下载地址:https://ai.meta.com/resources/models-and-libraries/llama-downloads/
7.Wix 推出AI网站生成器:根据文本构建整个网站
Wix 宣布推出一项新功能,即 AI 网站生成器,用户只需在一个框中输入描述并回答几个问题,即可自动生成整个网站,包括设计、文本和图片。该功能利用人工智能和算法创建一个独特的网站,相比现有的网站构建工具,更加容易上手。
8.清华ChatGLM2-6B模型允许免费商用
清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布,他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重,允许学术研究和商业使用。
9.Meta全新 AI 图像生成模型 CM3leon:更高效先进
Meta 正在继续推进对新形式生成式人工智能模型的研究,并公布了最新成果,名为 CM3leon(发音类似于「chameleon(变色龙)」)。CM3leon 是一个用于文本到图像创建和图像到文本创建的多模态基础模型,对于自动生成图像标题非常有用。
10.Stable Doodle:将草图转换为高质量图像
Stable Doodle 的素描转图像服务利用最新的 Stable Diffusion 模型,分析素描的轮廓并生成一个「视觉上令人愉悦」的艺术渲染图,该服务从已通过 ClipDrop 平台提供。Stable Doodle 的独特之处在于它允许对图像生成过程进行更「精确」的控制。
11.港科大版图像分割AI“Semantic-SAM”:更全能
香港科技大学团队开发出一款名为 Semantic-SAM 的图像分割 AI 模型,相比 Meta 的 SAM 模型,Semantic-SAM 具有更强的粒度和语义功能。该模型能够在不同粒度级别上分割和识别物体,并为分割出的实体提供语义标签。
Part3观点
1.马斯克:人工智能新公司 xAI 将提升特斯拉的价值
埃隆·马斯克表示,他的新企业( xAI)是一家专注于人工智能的初创公司,不会与电动汽车制造商竞争,甚至可能「提高特斯拉的价值」。
2.快看陈安妮:AIGC一定会打开国漫行业天花板
快看创始人、CEO陈安妮表示AI技术会打开漫画行业的天花板,行业将会迎来革命性的突破。她认为,快看的优势是对漫画产业以及行业各生产环节深度的理解,以及对用户群的需求和应用场景的理解。所以在AIGC的布局上,快看会更多专注在应用层,如何把AIGC技术拆解到每个生产环节的点上,进行需求提炼,深度打磨解决方案。
3.联合国警告:不受监管的AI芯片植入神经技术威胁“思想自由”
联合国建议不要使用不受监管的人工智能芯片植入神经技术,称这对人们的心理隐私构成严重风险。联合国表示,不受监管的神经技术可能会带来有害的长期风险,例如影响年轻人的思维方式或获取私人思想和情感。
4.美国证券交易委员会担心生成式AI会加剧金融市场风险
美国SEC 主席 Gary Gensler 在一次演讲中表示,生成式人工智能可能会增加金融市场的风险,因为它可能会导致金融机构使用不准确或不相关的信息做出错误决策。
5.媒体大亨巴里·迪勒称生成式AI“被夸大了”
媒体大亨 Barry Diller认为,生成式人工智能被过度宣传,但同时也对出版业造成了伤害,因为人工智能系统在公平使用原则下抓取了大量的版权内容。Diller 表示,最终需要立法或诉讼来保护出版商的版权。
6.联发科蔡明介:想象力、创造力与情感表达是 AI 无法取代的
联发科董事长蔡明介在为小学生写作集写序时指出,虽然 AI 工具已经可以帮助人们撰写履历、自传和回答编程问题等,但是拥有丰富想象力和创造力、能够清楚地理解和表达情感,并从中获得启示和智慧等能力是 AI 所无法取代的。
7.Stability AI CEO称:人工智能将成为有史以来最大的泡沫
Stability AI的创始人兼 CEO Emad Mostaque 认为,人工智能将成为有史以来最大的泡沫,并指出目前仍处于早期阶段,尚未准备好在银行等行业进行大规模采用。不过他表示这个泡沫甚至还没有开始。他还表示,人工智能需要总计约1万亿美元的投资,因为它对于知识基础设施的重要性比5G 更大,并建议像瑞银集团这样的银行必须采用这项技术,因为这是一个 “巨大的市场”。
Part4深度
1. 生成式AI管理规则落地 大模型后时代到来
在海内,外生成式AI经历了半年多无序狂奔后,中国对生成式AI的研发及服务做出明确的管理规范,标志着AI产业草莽时代的终结。在监管层面,《办法》指出,只要是利用生成式AI技术向中国境内公众提供生成文本、图片、音视频等内容的服务,都需要遵守规定。换言之,向国内用户提供服务的海外生成式AI应用也被囊括在监管范畴内。
2.我,用AI帮1000名准妈妈预测婴儿长相,每单卖9.9元
不少小商家利用 AI 技术赚钱,商家借助 Midjourney 平台的图像生成能力,在淘宝和小红书上开设店铺,提供诸如 “真人转卡通头像”、“四维产检彩超推演婴儿未来长相” 等服务。甚至有月销高的单品,定价66.6元,累计售出逾2000件,粗略估算,收入已超10万元。
3.AI监管新思路:为每个AI注入「灵魂」,让AI监管AI
有人提了一种全新的监管角度:让人工智能互相监督,互相竞争,甚至互相告密。人类有一天可能会跟不上人工智能的步伐,但不同的人工智能之间总会是势均力敌的。
4.汤姆猫+AI求IP“翻红”?股东年内忙减持
汤姆猫公司通过引入 AI 技术,希望提升汤姆猫 IP 的交互体验,转向陪伴方向。然而,AI 技术的应用尚未落地,公司股价在短期内蹭上涨后又下跌。同时,汤姆猫股东纷纷减持股份。虽然未来 AI 产品的表现和市场需求仍不确定,但汤姆猫 IP 需要寻找新的变现路径来保持竞争力。
5.AIGC先锋艺术家“土豆人”:如何成为AI时代的超级个体?
文章介绍了 AIGC 数字艺术家 “土豆人” 如何在 AI 时代成为超级个体的经历。他利用 AIGC 工具创作了多个出圈作品,并与多家知名品牌达成合作。他通过 AIGC 工具进行内容创作的心路历程,包括坍塌、重建和广阔三个阶段。他强调 AIGC 时代每个人都可以成为超级个体,但他也思考了在人人会 AI 的情况下,自己作为超级个体的价值和护城河在哪里。
6.AI发展现状报告:AI项目增长34000%、OpenAI主导
根据 Replit 公布的数据,人工智能项目在2022年第四季度以后呈爆发式增长,截至2023年第二季度末,有近300,000个与 AI 相关的项目。其中大约160,000个项目是在2023年第二季度创建的,同比增长34倍。在这些项目中,80% 以上使用了 OpenAI 的模型,而 OpenAI 的项目数量也增长了125,000个。此外,人工智能开源项目也在崛起,使用开源模型的项目数量超过了5,000个。此外,数据还显示 Python 和 JavaScript 是人工智能开发中常用的编程语言。