当前位置:首页|资讯|OpenAI|AI编程

开源日报 | OpenAI“草莓”发布;Docker修改订阅计划;中国最大MoE开源LLM;AI编程提高生产效率;土豪盯上半导体

作者:OSC开源社区发布时间:2024-09-29

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.9.13省流概览

-OpenAI 发布全新的 o1 系列模型

-Docker 修改其订阅计划

-元象发布中国最大 MoE 开源大模型

-神神叨叨的 OpenAI 和神神叨叨的草莓

-英伟达 CEO 黄仁勋接受高盛采访

-AI编程能提高局部生产效率

-知识图谱介绍:事物,而非字符串

-一个独特的数据集:提示词数据集

-中东土豪盯上了半导体

今日要闻

OpenAI 宣布推出其全新产品 OpenAI o1,也就是此前广受期待的代号为 “草莓(Strawberry)” 模型。按照官方技术博客说法,o1 在推理能力上代表了人工智能最强的水平。“o1 在回答问题之前会先思考,它可以在回复用户之前产生很长的内部思考链。”

OpenAI CEO Sam Altman 表示:“OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 AI。”

Docker 修改其订阅计划

Docker 宣布正在重新制定其订阅计划,以便所有计划都可以使用更多功能和服务,并且还将更新定价以反映新增功能。

随着新变化而来的还有价格的变化。Docker Personal 仍然免费,Docker Business 的定价也保持不变。Docker Pro 的价格从 5 美元 / 月涨至 9 美元 / 月,Docker Team 的价格从 9 美元 / 用户 / 月涨至 15 美元 / 用户 / 月。

元象发布中国最大 MoE 开源大模型 落地应用登顶港台榜

元象 XVERSE 发布中国最大 MoE 开源模型:XVERSE-MoE-A36B,加速 AI 应用低成本部署,将国产开源提升至国际领先水平。

该模型总参数 255B,激活参数 36B,达到 100B 模型性能的「跨级」跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。

免费下载大模型

Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B

魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B

Github:https://github.com/xverse-ai/XVERSE-MoE-A36B

今日观察社交观察

神神叨叨的 OpenAI 和神神叨叨的草莓

可以这么理解,o1 的 Reasoning 不是靠 reflect 的,这是 relection70B 的方式,但在对一个靠知识驱动的模型让它来去 reasoning 复杂的问题,其实就是自己问自己,还不是长步骤的思考(虽然 cot 能帮上一些忙)。o1 的 resaoning 的实现是数据集的方式,草莓 RL 吐出来的数据就是带多步逻辑的,拿这个做 pretrain。

- 微博Transformer-周

英伟达 CEO 黄仁勋接受高盛采访

英伟达 CEO 黄仁勋昨天在接受高盛采访时,深度阐述了大家关心的重要问题:AI 市场的前景,英伟达的护城河,以及供应链安全等。投资者显然对他的回答比较买账,英伟达股价昨天至今上涨了将近 10%。这个采访信息量很大,比美国总统选举辩论精彩多了。无论是否同意他的观点,都值得一读。

采访全文见https://seekingalpha.com/article/4720501-nvidia-corporation-nvda-ceo-jensen-huang-presents-goldman-sachs-communacopia-technology

- 微博硅谷陈源博士

AI 编程能提高局部生产效率的一个确定性的例子

AI 编程能提高局部生产效率的一个确定性的例子:在所有需要打日志的地方,Copilot 都能在输入一两个 log 开头的代码后,自动补全猜测的规整的日志打印,包含必要的局部变量打印。人工写的时候,这点通常是费劲的,有经验的程序员会力求打印好必要的 debug, info, warning, error 日志。新手往往日志不全或者不规整,诊断问题的时候就缺必要的日志。不过 AI 插件应该做的更 Agent 一点,在 git 提交的时候,自动把所有该打日志的地方批量补全,这是可以做到的,也是比较安全的操作。

- 微博幻灰龙

知识图谱介绍:事物,而非字符串

最近 GraphRAG 比较受关注,翻译一篇很早之前谷歌介绍知识图谱搜索的文章,理解下底层逻辑。

搜索在很大程度上与发现有关 —— 这是人类学习和拓宽视野的基本需求。但搜索仍然需要用户付出很多努力。所以今天我真的很兴奋的推出知识图谱,它将帮助你快速轻松的发现新的信息。执行一个查询,比如:[taj mahal](泰姬陵),四十多年以来,搜索基本上是对查询关键词的匹配。对于搜索引擎来讲,[taj mahal] 这个关键词只是两个词而已。

- 微博庆丰

一个独特的数据集:提示词数据集

这个数据集是从四个平台(Reddit、Discord、网站和开源数据集)中收集的 15140 个提示词,时间范围为 2022 年 12 月至 2023 年 12 月。其中,包括 1,405 个 Jailbreak 提示词(有统计规模最大)。

类比起来,提示词数据集就相当于之前的代码库吧。https://github.com/verazuo/jailbreak_llms

- 微博高飞

媒体观察

创新承压、洗牌持续,摩尔线程要做 “国产英伟达”?

换言之,摩尔线程已建立从芯片、板卡、服务器、集群到软件的全栈 AI 智算产品线,市场认为摩尔线程是国内仅有能从功能上对标英伟达的国产 GPU 芯片厂商。但持续补齐软件生态、AI 大模型技术迭代速度快带来的技术持续创新压力,以及国内 GPU 市场正进入洗牌阶段,让摩尔线程真正成为英伟达仍需持续发力。

-DoNews

大模型 “鬼故事” 缠上的不止百度

过去半年,市场对 AI 大模型的关注焦点从模型技术本身转向了智能应用的实际落地,AI 预期也开始回调。因此,在基础大模型的投入与 AI 应用落地之间做出取舍,实际上已成为所有大模型玩家不可回避的共同难题。

-市象

旋智即将推出多核心处理器!助力实现高性能电机控制产品

随着产业装备更新、汽车电子、新型空调热泵、工业控制等新兴应用需求的发展,电机控制芯片市场正经历快速增长,特别是对高能效、高性能电机控制处理器的需求急速上升。其中,国产替代空间巨大,亟待提升渗透率。

-网易新闻

中东土豪盯上了半导体

芯片已成为现代社会不可或缺的关键资源之一。中东对半导体的进军,已然拉开帷幕,未来会如何演绎还不得而知。在推进先进人工智能的过程中,中东地区还面临如何在沙漠中确保计算设施能够有效运行,以及大量水资源消耗的问题。

在中东的沙漠中,能否开出半导体的花,仍面临诸多挑战,前路漫漫。

-芯东西

我们的《黑神话:悟空》,应该由自己的网络靶场来守护

2024 年,《黑神话:悟空》在全球玩家的热切期盼中上线,然而首个周末,Steam 平台却因大规模 DDoS 攻击而崩溃,上百万玩家无法登录。据悉,这次攻击涉及近 60 个僵尸网络,攻击指令在一夜之间激增了 2 万多倍,攻击发生后,《黑神话:悟空》的实时在线人数一度骤降至百万以下。这场恶意攻击不仅重创了游戏体验,还为全球网络平台敲响了警钟,揭示了网络攻击的无处不在。

-数据猿

外滩大会专门发起倡议 “开源” 为何如此重要?

随着 AI 技术的发展,提高其安全性成为一个亟待解决的紧迫课题,而开源则是可靠一招。在日前举行的外滩大会上,赛事组委会发起开源倡议 —— 支持并鼓励优秀参与者开源比赛模型,降低技术门槛、加强技术交流,进而帮助更多人检测伪造内容,助力 AI 向善。

-上观新闻

今日推荐

开源项目

o2sh/onefetch

https://github.com/o2sh/onefetch

Onefetch 是一款由 Rust 编写的命令行 Git 信息工具,它将直接在终端中展示本地 Git 仓库的项目详情和代码统计等内容。工具完全离线可用(不需要网络连接)。

开源之声

用户观点

  • 观点 1:现在很多开源确实导致了企业对程序员的需求没有那么大,所以现在那么程序员被裁掉,而且企业之间都用开源相互恶性竞争,导致产品利润减少,而且质量不高。
    • 观点 2:你也是个奇葩
  • 观点 3:考虑过造张假钞再要求人行别发行人民币吗
  • 观点 4:我有点怀疑那个闭源软件是不是用了开源的代码
    • 观点 5:别怀疑,现在没有人能不依靠开源的力量从头造轮子
  • 观点 6:哈哈哈哈哈哈 这人这个发言多少带点脑缺
    • 观点 7:和大佬说话还班门弄斧的,问人家懂不懂网络攻防
  • 观点 8:分分钟已经找过 linux 要求闭源了
  • 观点 9:李胜传奇之重生之前干 IT
  • 观点 10:凭本事吃饭,大佬开源的都是大佬玩剩下的,实在是可笑不自量
  • 观点 11:把 kvm、openstack、k8s、c、c++、python、go、postgres… 等等全部闭源,他做一个出来收费,真是吃饱了,然后把锅砸了的逻辑…… 格局太小了,一辈子吃不了几个菜
  • 观点 12:这像是说,成龙不懂演戏,张学友不懂唱歌,哈哈
    • 观点 13:尤雨溪不懂 vue,jk 罗琳不懂哈利波特
  • 观点 14:> 无需 CA 证书即可捕获 SSL/TLS 通讯明文 这个怎么做到的 ……
    • 观点 15:直接用 ebpf 把密钥截获
  • 观点 16:国内开源届现状大赏
  • 观点 17:太抽象了 以至于我以为今天是愚人节
  • 观点 18:希望那人可以和鸿蒙对一下线,我看看谁能让他的 ass off
  • 观点 19:他的意思是:我抄完了,你可以闭源了!
  • 观点 20:难道他真的是天才
  • 观点 21:没有开源的话,写源码的人不断的在给自己打补丁,但是个人能力有限;对源码有需求的,不断在重复造轮子。没有开源精神,互联网能发展到现在???这都是写系统,写语言的大佬们带头奉献的结果
  • 观点 22:第一反应,不应该是合作吗?
  • 观点 23:不如 sspl 直接看源,闭源的都得逼着开给你
  • 观点 24:因为我无耻,所以我希望你跟我一样无耻。
  • 观点 25:没有闭源的商业思维还想做闭源产品
  • 观点 1:终于上道了,gpt 感觉就是玩具,推理才是真正实用的东西
  • 观点 2:实际使用下来,我个人的使用场景,并没有看到 o1 的特别大的优势。反而 Claude 3 Opus 依然效果是最好的。
  • 观点 3:希望工程师同行们可以指教我的看法是否正确,因为这方面我的掌握还不够。我个人认为是不是他们在跨区域 “适配数据” 所谓的思考就是单纯的 “数据内容匹配”!如果 open ai 说他可以独立思考那我个人认为,这种能力未来不好说但是现在并不存在!是不是又是个大忽悠,炒股票吹泡泡的套路。哈哈
    • 观点 4:AI 本质就是信息压缩,那么你相信 md5 可逆吗,反正我不信它

程序员梗图

END

References

https://www.oschina.net/news/311730/openai-o1

https://www.oschina.net/news/311774/docker-november-2024-updated

https://t.cj.sina.com.cn/articles/view/2118746300/7e4980bc02001h73q

http://weibo.com/1871474290/OwL5iplDT

https://weibo.com/6974787068/OwHkTCeUr

https://weibo.com/1873355712/OwHoRlzFZ

https://weibo.com/1762253415/OwGhAbWxR

https://weibo.com/1233486457/OwHkP4N0M

https://www.jfdaily.com/news/detail?id=795582

https://finance.sina.cn/2024-09-13/detail-incnyivy5830670.d.html

https://t.cj.sina.com.cn/articles/view/7310786248/1b3c1bec801901mol4

https://finance.sina.com.cn/roll/2024-09-13/doc-incnyivw9120216.shtml

https://www.thepaper.cn/newsDetail_forward_28718832

https://k.sina.cn/article_1654203637_629924f5020012hi0.html

https://github.com/o2sh/onefetch

https://mp.weixin.qq.com/s/TbbDsD4PNK6ttCvFAELxSg

https://mp.weixin.qq.com/s/4k5qIVcSDL2F5tVDBW3OUg

最后,欢迎扫码下载「开源中国 APP」

阅读海量技术报告、程序员极客分享


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1