当前位置:首页|资讯|OpenAI|腾讯|清华

开源日报 | OpenAI“草莓”曝光;DeepMind抄袭开源成果;MoE也有Scaling Law;程序员工作会消失吗?

作者:OSC开源社区发布时间:2024-07-25

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.7.15省流概览

-OpenAI 新研发项目 “草莓” 曝光

-openKylin 2.0 RC

-德国法院裁定 AI 发明可申请专利

-程序员工作会消失吗?

-基于 Rust 的开源「异构集群推理方案」

-谷歌 DeepMind 被曝抄袭开源成果

-AI 大模型正在走向工业规模化

-盘点今年融资 1 亿美元以上的 “美国 AI 独角兽”

今日要闻

OpenAI 新研发项目 “草莓” 曝光,用于提升大模型的推理能力

OpenAI 正在开发一项代号为「草莓」(Strawberry)的 AI 模型技术。内部文件显示,这一项目旨在提升 AI 的高级推理能力,使其不仅能够生成查询答案,还能自主规划并开展复杂研究。

据知情人士透露,OpenAI 希望通过 Strawberry 项目显著提高其 AI 模型的推理能力,克服当前 AI 在常识性问题上的不足。

Strawberry 的前身是去年首度披露的突破性项目 Q*。今年早些时候,OpenAI 小范围展示了用 Q* 解决当前模型难以应对的科学和数学难题。Strawberry 的关键在于「后训练」,这是在现有模型「预训练」过程之后附加的步骤,可以进一步优化 AI 模型的性能。这类似于斯坦福大学 2022 年发布的「自学推理」(Self-Taught Reasoner, STaR),都是通过训练数据的迭代来提升水平。

openKylin 2.0 RC

作为 openKylin 2.0 正式版发布前的一个重要版本,该版本除全面搭载社区重大特性成果外,还积极响应用户测试和反馈建议收集,累计修复 330+bug,包括系统安装、桌面环境、系统应用等主要模块。

Neo4j 开源基于 LLM 提取知识图谱的生成器:llm-graph-builder

LLM Graph Builder 可以把非结构化数据,PDF、文档、文本、YouTube 视频、网页等转换成存储在 Neo4j 中的知识图谱

利用大模型 OpenAI、Gemini 、Llama3、Diffbot、Claude、Qwen 等从非结构化数据中提取节点、关系及其属性(可自定义要提取的关系、节点)

主要特征:

1、知识图谱创建:使用 LLMs 将非结构化数据转换为结构化知识图谱。

2、提供 Schema:提供您自己的自定义 Schema 或使用已有的现有 Schema 来生成 graph

3、查看图表:在 Bloom 中一次查看特定源或多个源的 graph。

4、AI 聊天:对话即可查询与 Neo4j 数据库中的数据进行交互,还可提供来源的元数据(支持使用不同 RAG 方法(GraphRAG、Vector、Text2Cypher)进行知识问答)。

GitHub:github.com/neo4j-labs/llm-graph-builder

德国法院裁定 AI 发明可申请专利

德国最高民事法院联邦最高法院在日前的一起案件中裁定,由 AI 系统 DABUS 制作的午餐盒设计可申请获得专利。前提是,发明人这一身份必须归属于人类;具体来说,本案例中的发明人署名就是 DABUS 的作者。同时,申请书也要明确指出该产品是由 AI 构思的。

萨里大学法学与健康科学教授、Artificial Inventor Project 成员之一 Ryan Abbott 在一份声明中表示,该裁决 “确认了 AI 生产的发明是可保护的,并且自然人可以被列为发明人,即使该发明是使用 AI 产生的。”

今日观察社交观察

LSP 启动的那个进程的权限不小

最近在写自定义语言的 LSP 实现,发现 LSP 启动的那个进程的权限不小,不论是 JetBrain 或者 VSCode 应该不会去检查这个进程到底做了什么。双方只是在上架的时候扫描了一下,不过 JetBrain 的审核标准比 VSCode 高太多了。

因此编辑器的插件安装还是要谨慎,最好只能从商店安装,我目测肯定有开发者在做这个灰色生意了。

- 微博lazypeople

清华提出多智能体协作框架

来自清华、北大、北邮和腾讯的一篇新研究开源了 IoA 框架,目标是创建一个平台,让不同的 AI 智能体可以组队处理复杂的任务。

例如,像 AutoGPT 和 Open Interpreter 这样的智能体可以聚集在一起,组合各自的独特技能,共同解决单个智能体可能无法解决的棘手问题。

主要特点:

- 互联网启发架构:就像互联网连接人一样,IoA 可以连接不同环境中的不同 AI 智能体。

- 自主嵌套团队组建:智能体可自行组建团队和子团队,以适应复杂的任务。

- 异构智能体集成:将具有不同技能和背景的智能体聚集在一起,有点像组建一支全明星团队。

- 异步任务执行:智能体可以执行多任务,使整个系统更加高效。

- 自适应会话流:会话流可自主管理,以保持智能体会话的结构性和灵活性。

- 可升级和可扩展:可轻松添加新类型的智能体或处理不同类型的任务。

代码:https://github.com/OpenBMB/IoA

- 微博量子位

程序员工作会消失吗?

即使 AI 使编程变得更容易,也可能不会减少对程序员的总体需求,而是可能创造更多的机会和需求。如果 "软件开发变得更便宜了,制作软件和程序员变得更高效了,不一定减少对程序员的需求,实际上可能增加了对程序员的需求。"

但是,如果换一个角度思考,虽然讨论中举例说 Word 的出现,没有让打字变少。但是客观讲,专业打字员工作确实消失了。也就是说,我们确实需要更多的人打字了,但是打字的人,是每一个人,而不是一个专业工种。

如果模型让编程变得容易,那么确实人人都可以是程序员,但是 “程序员” 这个工作,也真的可能会消失。“程序员” 会消失,和 “编程会更繁荣”,两个结论并不矛盾。

- 微博高飞

基于 Rust 的开源「异构集群推理方案」

有个老哥基于 Rust 开源了「异构集群推理方案」,可组合多台 iPhone,iPad,Macbook 组成 Tranformer 推理服务器,运行 Llama3-70B 模型。释放老旧设备算力,支持 Linux、iOS、Windows 等老旧设备组成异构集群提供分布式 LLM 推理算力。

Github:github.com/evilsocket/cake

- 微博斌叔 OKmath

媒体观察

人形机器人 “进步” 神速

人形机器人功能的不断精进,不仅能提升人类生活便捷性、工作效率和生产力水平,还将改善医疗健康服务,丰富教育、娱乐体验等,为人类生活带来全方位、深层次的改变。目前,人形机器人发展动能愈加强劲

-经济日报

研究称人工智能测谎利弊并存

研究人员说,这项已发表在《交叉科学》杂志上的研究表明,虽然利用人工智能测谎可能促使人们在交流时更加诚实,但也可能严重破坏社会和谐,毕竟如果人们更频繁地质疑对方撒谎,会增加人与人之间的不信任。因此,他们呼吁建立一个全面的法律框架,在利用好新技术的同时,降低其可能带来的风险。

-新华网

谷歌 DeepMind 被曝抄袭开源成果,论文还中了顶流会议

大模型圈再曝抄袭大瓜,这回,“被告” 还是大名鼎鼎的谷歌 DeepMind。

“原告”直接怒喷:他们就是把我们的技术报告洗了一遍!

具体是这么个事儿:

谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了,瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。两篇论文探讨的都是一种规范模型文本生成结构的方法。

抓马的是,谷歌DeepMind这篇论文中确实明晃晃写着引用了“原告”的论文。

-量子位

一共 28 家!盘点今年融资 1 亿美元以上的 “美国 AI 独角兽”

Crunchbase 最近的数据显示,仅在 2024 年上半年,全球就有超过 355 亿美元流向 AI 初创公司。在 2024 年上半年募集的六轮超过 10 亿美元的风险投资中,其中五轮是由人工智能公司募集,其他 AI 初创公司也募集到了超 1 亿美元的巨额资金。

-华尔街见闻

AI for DB 进入新竞争周期 | 企服国际观察

不过,从目前来看,AI 与数据库的结合思路,也不仅仅是与向量检索相关。过去几年,像自治数据库、数据库自监控自诊断、将低代码 + AI 引入到 text2SQL 等等,都是业内企业客户还在探索、尚无定论的方向。

但也有业内人士警示,AI 与数据库的结合仍然是个很新的技术方向,也可能存在技术的踏空。

-钛媒体

MoE 也有 Scaling Law,「百万专家」利用率近 100%!DeepMind 华人挑战 MoE 极限

如果你熟悉当前 LLM 的主流架构,混合专家(MoE)技术想必是老朋友之一。有人甚至会说,MoE 是使大模型崛起的关键因素之一。

开源的 Mixtral、DBRX、Grok 等模型都使用了 MoE,而且根据 Soumith Chintala 等大佬的推测,GPT-4 也是一个规模为 8×220B 的 MoE 模型。

-新智元

AI 大模型正在走向工业规模化

当下,AI 大模型正成为产业新型基础设施并为千行百业提供智能服务,且以 “基础大模型 + 行业数据微调” 的范式推动 AI 研发生产从传统小规模作坊式走向工业规模化量产,与此同时,也为各行各业带来了前所未有的变革。

-中国高新技术产业导报

今日推荐

开源项目

ekzhang/sshx

https://github.com/ekzhang/sshx

sshx 可让你通过网络进行快速、协作的实时终端共享。它具有实时协作、远程光标和聊天功能。它还采用 Rust 编写的轻量级服务器,速度快、端到端加密。只需一条命令即可安装 sshx。将其用于教学、调试或云访问。

每日一博

淘宝互动游戏之我养的鸡要旅行

去年写过一篇关于前端业务代码分层的文章《小鸡 PK 业务架构治理记录》,主要是针对于 rax 这个视图引擎的,本文的区别在于属于混合开发的模式,Phaser 游戏开发的内容占比甚至比传统的前端 rax/react 开发更多。

对于我们的分层模式来说其实没什么区别,只不过多了一种渲染方式而已,用 phaser 渲染和用 react 还是 rax 渲染其实都没什么区别。

https://my.oschina.net/u/4662964/blog/11523876

开源之声

用户观点

区区 1 万张表就把 MySQL 给整崩溃了

  • 观点 1:mysql 5.6 不能用还是咋地 为啥非要升级 我......
  • 观点 2:你听听,区区一万张表,这叫什么话
    • 观点 3:1 万张表真的太少了
    • 观点 4:如果是做报表采集的话,一万张表还是正常的
  • 观点 5:Oracle 不就是希望 MySQL 日渐式微么
  • 观点 6:oracle 团队可能正在对 mysql 进行比较大的重构。估计 mysql 的屎山代码让 oracle 工程师都无语了。
  • 观点 7:但凡脑子正常点的,不会一个实例建 10000 张表,没有考虑到疯子
  • 观点 8:我的生产超过 1W 张表了,还好用的 5.7
  • 观点 9:确实够拉跨的
Go 语言有个 “好爹” 反而被程序员讨厌?
  • 观点 1:go 难道不是因为开源社区的氛围才挨骂的嘛,啥都好,问题和缺陷修的很快,疑问无论是小白问题还是大问题都会细心和你解答,但是你的提案他们不可能接受,毕竟自己的人 kpi 更重要。与其说是个开源语言不如说是个开源产品
    • 观点 3:pr 也是,自己的人 pr 特别热情做 review 合进去,外面的大牛来了就打太极,draft 我们讨论一下。然后就没下文了。至于无名无姓的,呵呵,人家看都不会看一眼
    • 观点 2:技术本身导致社区不够有趣,否则开源大神一个 fork,战地转移完全有可能
  • 观点 4:感觉不如编程原神的 rust
  • 观点 5:我怎么觉得这些都是优点呢
  • 观点 6:我觉得这是最舒服的语言
    • 观点 7:如果没有太多的 error 需要处理 写着真的很爽
  • 观点 8:性能案例作假
  • 观点 9:嫌 error 处理多的,去试试 java 的 throw exception hell
    • 观点 10:go 你每个 err 基本都要 return,代码极其繁琐。java 只要顶层 try 一下就行了,内部异常自动跳出。
  • 观点 11:依赖管理和命名返回都是垃圾设计
  • 观点 12:写业务是一蹋糊涂,真搞不明白国内还乐此不疲的 PHP=Golang?
    • 观点 13:Golang>PHP
  • 观点 14:我一看到 肯 汤普森 在设计团队里才学的语言。然后发现 go 语言里的特性是很优秀的。唯一的问题是 go 语言太落后了。
    • 观点 15:感觉不落后,只是有些地方不太好用, 在写 curd 时,不能像 c# 一样,前后端一气呵成, 遇到数据库有 null 字段,时间有 null,时间格式化等,处理起来不太好用。
  • 观点 16:我的评价是不如 php
  • 观点 17:我还是那句话 kotlin 优雅 yyds
  • 观点 18:如果支持重载就非常完美了
  • 观点 19:我觉得 go 的语法真的丑
苹果批准 UTM SE,经典 PC 模拟器已上架 App Store
  • 观点 1:好 ipados 终于有点生产力了 搞个 windows 装点软件 不然 ipad 这么强大的性能就是摆设
  • 观点 2:活久见了
  • 观点 3:没有 JIT,靠 CPU 模拟,性能会差一截的。
Vue 诞生 10 年,创始人尤雨溪推动 “锈化”——通过 Rust 提升 Web 基础设施性能
  • 观点 1:以前流行 js 框架用 js 实现工具链实现自举,现在变成用 rust 提高性能
  • 观点 2:20 年前奔四 cpu,用 JS 写的网站飞快,现在 4 核 8 核,用 vue 写的前端感觉很卡。
  • 观点 3:vue 老浏览器都打不开,兼容性不好
  • 观点 4:真没必要 Rust,对于命令行工具来说 go 已经足够好了
    • 观点 5:可能还考虑到了 wasm 吧
  • 观点 6:前端被整的越来越卡,浏览器内存老高。
  • 观点 1:能不能把内存占用改改,净整些花里胡哨的
    • 观点 2:他用 java 内存占用再优化也好不到哪去
  • 观点 3:越来越像 vs code
    • 观点 4:应该说是 vscode 设计的确实好
  • 观点 5:和现在的 2024.1 看不出任何区别
    • 观点 6:就是默认开启新 UI 了而已。。原本是默认不开启的。
  • 观点 7:赶紧把 clione nova 搞好合并进 clion 这才是正事。fleet 还没有正式版啊 还要多久
    • 观点 8:不是已经合了吗?还有 nova 吗?
  • 观点 9:还是喜欢 Material ui
  • 观点 10:用了几天,还是不习惯
  • 观点 11:rider 开大项目比 vs 还要卡,我以为 vs 的设计器已经够卡了,rider 比他还卡,不过看在 rider 代码补全机制比较优秀还是忍忍
  • 观点 12:能不能便宜点
  • 观点 13:我都用了 1、2 年新 UI 了,特别棒!比经典的 UI 清爽多了!很喜欢!
  • 观点 14:不知道什么时候 visual studio 也能跟上,idea 这个模式开小窗口的时候很友好
  • 观点 15:Fira code 字体在新 ui 里显示不太正常 字符间距格外的小
  • 观点 16:新 UI 我倒是挺喜欢,新终端做的不好,用起来很卡
  • 观点 17:降低了视觉复杂性,增高了操作复杂性。

    程序员梗图

    END

    References

    https://weibo.com/3894431038/OnltODyNX

    https://www.oschina.net/news/302111/openkylin-2-0-rc

    https://www.oschina.net/news/302075/openai-working-new-reasoning-technology-strawberry

    https://www.oschina.net/news/302157/german-court-ai-generated-patents

    https://weibo.com/1222673811/OnlnCkfRW

    https://weibo.com/1233486457/Onkoh3G2N

    https://weibo.com/1912085257/OnEm1oWaB

    https://weibo.com/6105753431/OnDKerxBj

    http://paper.chinahightech.com/pc/content/202407/15/content_54638.html

    https://3g.k.sohu.com/t/n806080311

    https://ishare.ifeng.com/c/s/8bEp6GFTJry

    https://wallstreetcn.com/articles/3719537

    https://news.sina.cn/ai/2024-07-15/detail-inceevpf5061983.d.html

    https://baijiahao.baidu.com/s?id=1804624834100580344&wfr=spider&for=pc

    https://3g.k.sohu.com/t/n805975704

    https://my.oschina.net/u/4662964/blog/11523876

    https://github.com/ekzhang/sshx

    https://mp.weixin.qq.com/s/tSKez3tVDZJ6UnQNvZZecQ

    https://mp.weixin.qq.com/s/k9e9q2eE4kJdoMruMA0QmA

    https://mp.weixin.qq.com/s/SyIZNiPh-71b1X7nMAQsGQ

    https://mp.weixin.qq.com/s/TYGYb8YA9c_pS8LhQwrylg

    最后,欢迎扫码下载「开源中国 APP」

    阅读海量技术报告、程序员极客分享


    Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1