Arm正式IPO，Meta计划对标GPT-4训练下一代大模型，Adobe Firefly 生成式 AI 模型全面开放商用｜36氪GPT周报

作者：沈筱发布时间：2023-09-18

作者：子渝

编辑：沈筱

微软发布1.3B参数量小模型，效果优于7B参数Llama2

9月11日，微软发布开源模型phi-1.5，在只支持代码的1.0版本之上加入了一般场景对话。该模型的参数量只有1.3B，但效果已经超过了拥有7B参数的Llama2。phi团队一致认为，数据的质量远比数量更重要。所以与一众卷参数量的模型相比，phi-1.5不仅参数量不到Llama2的五分之一，训练时所用的token更是少了一个数量级，只用了3千亿的训练数据。但phi-1.5在AGIEval、 LM-Eval等多个Benchmark上都取得了比Llama2还要优异的成绩。

https://www.sohu.com/a/721106310_610300

英伟达 GH200 超级芯片首次亮相 MLPerf v3.1，性能跃升 17%

9月11日，推出不到两个月的英伟达GH200 Grace Hopper超级芯片首次亮相MLPerf行业基准测试。在此次测试中，具有更高的内存带宽和更大的内存容量的GH200与H100 GPU相比，性能高出17%。此次MLPerf Inference v3.1基准测试是继4月发布3.0版本之后的又一次更新，这次更新包含了两个方面：引入基于60亿参数大语言模型GPT-J的推理基准测试（AI模型的大小通常根据它有多少参数来衡量）和改进的推荐模型。

https://www.thepaper.cn/newsDetail_forward_24580685

Meta计划对标GPT-4训练下一代大模型

9月11日消息，Meta购入大量英伟达H100芯片，并积极扩建数据中心，减少对微软Azure云平台的依赖，以创建一款更为强大、复杂的聊天机器人。Meta 将 GPT-4 作为其下一个 AI 模型的标准，并计划在2024年开始训练，旨在模仿人类的表情和感情，提供更加逼真的交互体验。根据此前泄露的消息，Instagram正在测试一个具有30种性格的聊天机器人，可能与公司即将推出的未公布的人工智能“角色”相关联。

https://new.qq.com/rain/a/20230911A04IZL00

字节跳动旗下“悟空搜索”App更名“小悟空”，提供200+AI工具

9月11日消息，字节跳动于去年推出“悟空搜索”App，主打“无广告搜索”。现在，这款 App 宣布更名为“小悟空”。小悟空 App 内包含基于大语言模型的 AI 工具合集，支持智能对话和辅助推荐功能。智能工具分类包括创作生成、学习提升、工作职场、专业咨询、虚拟角色、休闲娱乐等，用户可以使用该工具进行翻译、法律咨询、趣味测试等操作。

https://www.ithome.com/0/718/425.htm

研究发现ChatGPT可在七分钟内完成软件开发，平均成本不足1美元

9月12日消息，来自布朗大学和多所中国大学的研究团队进行了一个实验，探究是否可以用 ChatGPT 的 3.5 版本的语言模型来驱动的人工智能机器人，在没有事先训练的情况下完成软件开发过程。研究者创建了一个假想的软件开发公司，名为 ChatDev。研究表明，这个由人工智能驱动的公司平均可以在不到七分钟内以不到一美元的成本完成整个软件开发过程，同时通过其“记忆”和“自我反思”的能力识别和解决“潜在漏洞”。

https://www.ithome.com/0/718/638.htm

国内外高校联合开源强化学习策略，让机器狗能跑酷

9月12日消息，来自上海期智研究院、斯坦福大学、上海科技大学、卡内基梅隆大学和清华大学的研究者联合开展了一个项目，旨在通过开源强化学习策略让机器狗掌握多样化的通用技能，以迅速应对各种场景和障碍。该项目基于一种新的开源系统，可以学习基于视觉的端到端跑酷策略，无需依赖任何参考动作数据。这种强化学习方法能够让机器狗学会攀爬高障碍、跳过大间隙、在低障碍下爬行、挤过狭小缝隙和跑步等技能，并将这些技能整合成一个基于视觉的跑酷策略，可以直接部署到四足机器人上。

https://new.qq.com/rain/a/20230912A04MBX00

用户反映llama2.mojo实现比llama2.c快20%的效果

9月12日消息，一名Mojo社区成员将Python程序llama2.py移植到Mojo上，实现了比原版llama.c快20%的效果，显示了Mojo在硬件级优化方面的巨大潜力。Mojo是一种新的面向AI开发人员的编程语言，其目标是将Python的易用性与系统编程功能结合，实现高性能计算。Mojo可以无缝集成Python代码和库，同时提供与C++和CUDA相匹配的性能。Mojo的发明者Chris Lattner表示，他创立的公司Modular新获得的1亿美元融资将用于推动Mojo的进一步发展和产品扩展。

https://finance.sina.com.cn/tech/roll/2023-09-12/doc-imzmmpkq5281189.shtml

腾讯健康公布医疗大模型，并发布AI医疗产品矩阵

9月12日消息，据腾讯健康官方公众号报道，腾讯健康在日前公布了旗下医疗大模型，并发布“智能问答、家庭医生助手、数智医疗影像平台等多场景 AI 产品矩阵”，以及药物发现平台“云深”（iDrug）。这一医疗大模型基于腾讯混元大模型，适用于文案生成、智能问答、病历结构化和检索、影像报告和辅助诊断等场景，可嵌入医疗环节全流程；同时，在 AI 驱动药物发现方面，腾讯宣称，旗下 “云深”（iDrug）平台已同时具备了小分子药物与大分子药物的加速发现能力。

https://www.ithome.com/0/718/473.htm

Adobe Firefly 生成式 AI 模型全面开放商用

9月13日消息，Adobe宣布，经过几个月的测试，Firefly生成式AI模型已正式上线，可在Adobe Creative Cloud、Adobe Express和Adobe Experience Cloud等多个应用中使用。此外，Adobe还推出了一个独立的Firefly网页应用，让用户在不使用特定的Adobe Creative Suite应用的情况下，也可以体验生成式AI的功能。

https://www.ithome.com/0/718/969.htm

华人团队提出Medusa简单框架，可将LLM推理速度提高2倍

9月13日消息，来自普林斯顿、UIUC等机构的华人团队提出一个用于加速大型语言模型（LLM）推理速度的简单框架Medusa，并于9月12日开源发布。Medusa通过增加多个解码头来加速模型的推理速度，而无需引入额外的草稿模型，这种方法允许研究人员在单个GPU上微调大模。测试结果显示，Medusa可以将LLM的生成效率提高约2倍。

https://www.chinaz.com/2023/0913/1558833.shtml

清华联合北邮和微信团队推出多智能体宇宙，可模拟各类社会实验场景

清华大学联合北邮和微信团队推出了一个名为“AgentVerse”的多智能体宇宙，专门针对大语言模型开发，已在GitHub获得1.1k星标。该项目简化了使用大语言模型构建自定义多智能体环境的过程，只需几行简单配置即可模拟各种社会实验场景，如“囚徒困境”和“NLP课堂”。

https://www.thepaper.cn/newsDetail_forward_24583658

阿里云通义千问 AI 大模型已通过备案，正式向公众开放

9月13日消息，阿里云今日宣布通义千问大模型已首批通过备案，并正式向公众开放。目前，OPPO、得物、钉钉、淘宝、浙江大学等已与阿里云达成合作，基于通义千问训练自己的专属大模型或开发大模型应用。

https://www.ithome.com/0/718/755.htm

知网推出“AIGC 检测服务系统”，用以识别学术文本中AI 生成内容

9月13日消息，同方知网官网今日发布公告，宣布全新推出“AIGC 检测服务系统”，号称历时半年，探索 AIGC 运行规律并攻克内容识别、算法效率、可信评估等技术难题，经大数据测试、检测效果验证、检测效率调优等服务优化改进。首次提出“知识增强 AIGC 检测技术”和若干检测算法，从语言模式和语义逻辑两条链路，用 AI 对抗 AIGC，最终实现识别学术文本中的 AI 生成内容。

https://www.ithome.com/0/718/925.htm

Stability AI 发布文本生成音频产品Stable Audio

9月14日消息，Stability AI 公司近日推出 Stable Audio，可基于用户输入的文本内容，自动生成多种类型和风格的音频内容，包括音乐、语音、环境声、特效等。Stability AI 宣称，Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频，并且只需要一个 NVIDIA A100 GPU。

https://new.qq.com/rain/a/20230914A015WO00

谷歌被曝小范围测试Gemini，比训练GPT-4算力大5倍

9月15日消息，据三位直接知情人士透露，谷歌已经允许一小部分公司使用 Gemini 软件的早期版本，意味着谷歌即将将其纳入消费者服务，并通过公司的云计算服务出售给企业；同时，Gemini 已开始在新的 TPUv5 Pod上进行训练，算力高达～1e26 FLOPS，比训练 GPT-4的算力还要大5倍；另外，Gemini 的训练数据库为Youtube上 93.6亿分钟的视频字幕，总数据集大小约为GPT-4的两倍。

https://36kr.com/p/2432997666886022

微软开源EvoDiff，用AI生成蛋白质框架

9月15日消息，微软开源了一个蛋白质生成框架EvoDiff。该框架使用AI技术，能够在没有目标蛋白质结构信息的情况下，生成生成高保真、多样化的蛋白质序列。EvoDiff的核心是一个拥有6.4亿参数的模型，该模型通过使用来自不同物种和功能类别蛋白质的数据进行训练，使模型具备生成高质量蛋白质序列的能力。创新之处在于，它不再依赖蛋白质结构信息，而是基于蛋白质序列来生成蛋白质。

https://www.kejixun.com/article/582034.html

Arm正式IPO，上市首日大涨近25%

9月14日，作为今年目前最大IPO，英国芯片设计公司ARM正式登录纳斯达克，首日涨超25%，市值达650亿美元。当今几乎所有的手机芯片，都是基于ARM的架构设计的，除此之外，ARM架构在汽车、智能手表等行业也有较高的市占率。ARM表示，由于数据中心和人工智能芯片需求的推动，预计本财年收入增长11%，2025财年收入增长率能达到20%左右。

https://36kr.com/p/2432884592546432

字节团队发布两个AI视频项目，可实现多模态动画生成和文本视频编辑

9月15日消息，字节团队在Github上发布两个AI视频项目。一个是MagicAvatar，主多模态动画生成，可以将文本、视频和音频等不同输入方式转化为动作信号，从而生成和动画化一个虚拟人物；另一个是MagicEdit，专注文本导向的视频编辑，用户进行自然语言提示，就可改变视频风格、场景甚至替换视频里的对象或添加元素。目前在Github上，两个项目加起来已经拿到1000+星。

https://36kr.com/p/2417388284961540

百度希壤与高通达成战略合作，拟打造元宇宙基础设施平台

9月15日消息，近期，北京百度网讯科技有限公司与高通无线通信技术（中国）有限公司在北京签署非约束性战略合作谅解备忘录，将在XR领域展开全面战略合作。通过此次战略合作的宣布，双方期望在未来开展深度的技术、市场与生态合作，其中包括双方将在XR技术、生成式AI、数字人、产业上下游协同等方面，围绕元宇宙+生态+行业应用共同打造新一代元宇宙基础设施平台。

https://www.chinaz.com/2023/0915/1559598.shtml

国内多个AI绘画网站疑因违规关停

9月15日消息，国内多个基于AIGC技术建立的AI绘画网站突然下线。目前，像广大网友熟知的四必三、哩布哩布等纷纷在无预警情况下被关停，或转移到境外域名，并在国内无法正常访问。不少网友怀疑合规方面或出现问题。

https://mp.weixin.qq.com/s/HdwLkkhyD6OWlO4gUppVuQ

快手开启AI 文生图功能内测

9月15日，快手宣布在短视频评论区开始内测 AI 文生图功能 —— 快手 AI 玩评，用户通过输入各种创意文字，可一键生成海量风格图片，更便捷地在评论区进行趣味互动。据悉，这是继快手 AI 对话之后，快手在短视频场景内探索并落地的又一 AIGC 能力，这也是业内首次在大型 App 核心业务场景评论区下应用的 AIGC 能力。

https://www.ithome.com/0/719/336.htm