欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.9.13省流概览
-OpenAI 发布全新的 o1 系列模型
-Docker 修改其订阅计划
-元象发布中国最大 MoE 开源大模型
-神神叨叨的 OpenAI 和神神叨叨的草莓
-英伟达 CEO 黄仁勋接受高盛采访
-AI编程能提高局部生产效率
-知识图谱介绍:事物,而非字符串
-一个独特的数据集:提示词数据集
-中东土豪盯上了半导体
今日要闻
OpenAI 宣布推出其全新产品 OpenAI o1,也就是此前广受期待的代号为 “草莓(Strawberry)” 模型。按照官方技术博客说法,o1 在推理能力上代表了人工智能最强的水平。“o1 在回答问题之前会先思考,它可以在回复用户之前产生很长的内部思考链。”
OpenAI CEO Sam Altman 表示:“OpenAI o1 是一个新范式的开始:可以进行通用复杂推理的 AI。”
Docker 修改其订阅计划
Docker 宣布正在重新制定其订阅计划,以便所有计划都可以使用更多功能和服务,并且还将更新定价以反映新增功能。
随着新变化而来的还有价格的变化。Docker Personal 仍然免费,Docker Business 的定价也保持不变。Docker Pro 的价格从 5 美元 / 月涨至 9 美元 / 月,Docker Team 的价格从 9 美元 / 用户 / 月涨至 15 美元 / 用户 / 月。
元象发布中国最大 MoE 开源大模型 落地应用登顶港台榜
元象 XVERSE 发布中国最大 MoE 开源模型:XVERSE-MoE-A36B,加速 AI 应用低成本部署,将国产开源提升至国际领先水平。
该模型总参数 255B,激活参数 36B,达到 100B 模型性能的「跨级」跃升,同时训练时间减少 30%,推理性能提升 100%,使每 token 成本大幅下降。
免费下载大模型
Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A36B
魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A36B
Github:https://github.com/xverse-ai/XVERSE-MoE-A36B
今日观察社交观察
神神叨叨的 OpenAI 和神神叨叨的草莓
可以这么理解,o1 的 Reasoning 不是靠 reflect 的,这是 relection70B 的方式,但在对一个靠知识驱动的模型让它来去 reasoning 复杂的问题,其实就是自己问自己,还不是长步骤的思考(虽然 cot 能帮上一些忙)。o1 的 resaoning 的实现是数据集的方式,草莓 RL 吐出来的数据就是带多步逻辑的,拿这个做 pretrain。
- 微博Transformer-周
英伟达 CEO 黄仁勋接受高盛采访
英伟达 CEO 黄仁勋昨天在接受高盛采访时,深度阐述了大家关心的重要问题:AI 市场的前景,英伟达的护城河,以及供应链安全等。投资者显然对他的回答比较买账,英伟达股价昨天至今上涨了将近 10%。这个采访信息量很大,比美国总统选举辩论精彩多了。无论是否同意他的观点,都值得一读。
采访全文见https://seekingalpha.com/article/4720501-nvidia-corporation-nvda-ceo-jensen-huang-presents-goldman-sachs-communacopia-technology
- 微博硅谷陈源博士
AI 编程能提高局部生产效率的一个确定性的例子
AI 编程能提高局部生产效率的一个确定性的例子:在所有需要打日志的地方,Copilot 都能在输入一两个 log 开头的代码后,自动补全猜测的规整的日志打印,包含必要的局部变量打印。人工写的时候,这点通常是费劲的,有经验的程序员会力求打印好必要的 debug, info, warning, error 日志。新手往往日志不全或者不规整,诊断问题的时候就缺必要的日志。不过 AI 插件应该做的更 Agent 一点,在 git 提交的时候,自动把所有该打日志的地方批量补全,这是可以做到的,也是比较安全的操作。
- 微博幻灰龙
知识图谱介绍:事物,而非字符串
最近 GraphRAG 比较受关注,翻译一篇很早之前谷歌介绍知识图谱搜索的文章,理解下底层逻辑。
搜索在很大程度上与发现有关 —— 这是人类学习和拓宽视野的基本需求。但搜索仍然需要用户付出很多努力。所以今天我真的很兴奋的推出知识图谱,它将帮助你快速轻松的发现新的信息。执行一个查询,比如:[taj mahal](泰姬陵),四十多年以来,搜索基本上是对查询关键词的匹配。对于搜索引擎来讲,[taj mahal] 这个关键词只是两个词而已。
- 微博庆丰
一个独特的数据集:提示词数据集
这个数据集是从四个平台(Reddit、Discord、网站和开源数据集)中收集的 15140 个提示词,时间范围为 2022 年 12 月至 2023 年 12 月。其中,包括 1,405 个 Jailbreak 提示词(有统计规模最大)。
类比起来,提示词数据集就相当于之前的代码库吧。https://github.com/verazuo/jailbreak_llms
- 微博高飞
媒体观察
创新承压、洗牌持续,摩尔线程要做 “国产英伟达”?
换言之,摩尔线程已建立从芯片、板卡、服务器、集群到软件的全栈 AI 智算产品线,市场认为摩尔线程是国内仅有能从功能上对标英伟达的国产 GPU 芯片厂商。但持续补齐软件生态、AI 大模型技术迭代速度快带来的技术持续创新压力,以及国内 GPU 市场正进入洗牌阶段,让摩尔线程真正成为英伟达仍需持续发力。
-DoNews
大模型 “鬼故事” 缠上的不止百度
过去半年,市场对 AI 大模型的关注焦点从模型技术本身转向了智能应用的实际落地,AI 预期也开始回调。因此,在基础大模型的投入与 AI 应用落地之间做出取舍,实际上已成为所有大模型玩家不可回避的共同难题。
-市象
旋智即将推出多核心处理器!助力实现高性能电机控制产品
随着产业装备更新、汽车电子、新型空调热泵、工业控制等新兴应用需求的发展,电机控制芯片市场正经历快速增长,特别是对高能效、高性能电机控制处理器的需求急速上升。其中,国产替代空间巨大,亟待提升渗透率。
-网易新闻
中东土豪盯上了半导体
芯片已成为现代社会不可或缺的关键资源之一。中东对半导体的进军,已然拉开帷幕,未来会如何演绎还不得而知。在推进先进人工智能的过程中,中东地区还面临如何在沙漠中确保计算设施能够有效运行,以及大量水资源消耗的问题。
在中东的沙漠中,能否开出半导体的花,仍面临诸多挑战,前路漫漫。
-芯东西
我们的《黑神话:悟空》,应该由自己的网络靶场来守护
2024 年,《黑神话:悟空》在全球玩家的热切期盼中上线,然而首个周末,Steam 平台却因大规模 DDoS 攻击而崩溃,上百万玩家无法登录。据悉,这次攻击涉及近 60 个僵尸网络,攻击指令在一夜之间激增了 2 万多倍,攻击发生后,《黑神话:悟空》的实时在线人数一度骤降至百万以下。这场恶意攻击不仅重创了游戏体验,还为全球网络平台敲响了警钟,揭示了网络攻击的无处不在。
-数据猿
外滩大会专门发起倡议 “开源” 为何如此重要?
随着 AI 技术的发展,提高其安全性成为一个亟待解决的紧迫课题,而开源则是可靠一招。在日前举行的外滩大会上,赛事组委会发起开源倡议 —— 支持并鼓励优秀参与者开源比赛模型,降低技术门槛、加强技术交流,进而帮助更多人检测伪造内容,助力 AI 向善。
-上观新闻
今日推荐
开源项目
o2sh/onefetch
https://github.com/o2sh/onefetch
Onefetch 是一款由 Rust 编写的命令行 Git 信息工具,它将直接在终端中展示本地 Git 仓库的项目详情和代码统计等内容。工具完全离线可用(不需要网络连接)。
开源之声
用户观点
- 观点 1:现在很多开源确实导致了企业对程序员的需求没有那么大,所以现在那么程序员被裁掉,而且企业之间都用开源相互恶性竞争,导致产品利润减少,而且质量不高。
- 观点 2:你也是个奇葩
- 观点 3:考虑过造张假钞再要求人行别发行人民币吗
- 观点 4:我有点怀疑那个闭源软件是不是用了开源的代码
- 观点 5:别怀疑,现在没有人能不依靠开源的力量从头造轮子
- 观点 6:哈哈哈哈哈哈 这人这个发言多少带点脑缺
- 观点 7:和大佬说话还班门弄斧的,问人家懂不懂网络攻防
- 观点 8:分分钟已经找过 linux 要求闭源了
- 观点 9:李胜传奇之重生之前干 IT
- 观点 10:凭本事吃饭,大佬开源的都是大佬玩剩下的,实在是可笑不自量
- 观点 11:把 kvm、openstack、k8s、c、c++、python、go、postgres… 等等全部闭源,他做一个出来收费,真是吃饱了,然后把锅砸了的逻辑…… 格局太小了,一辈子吃不了几个菜
- 观点 12:这像是说,成龙不懂演戏,张学友不懂唱歌,哈哈
- 观点 13:尤雨溪不懂 vue,jk 罗琳不懂哈利波特
- 观点 14:> 无需 CA 证书即可捕获 SSL/TLS 通讯明文 这个怎么做到的 ……
- 观点 15:直接用 ebpf 把密钥截获
- 观点 16:国内开源届现状大赏
- 观点 17:太抽象了 以至于我以为今天是愚人节
- 观点 18:希望那人可以和鸿蒙对一下线,我看看谁能让他的 ass off
- 观点 19:他的意思是:我抄完了,你可以闭源了!
- 观点 20:难道他真的是天才
- 观点 21:没有开源的话,写源码的人不断的在给自己打补丁,但是个人能力有限;对源码有需求的,不断在重复造轮子。没有开源精神,互联网能发展到现在???这都是写系统,写语言的大佬们带头奉献的结果
- 观点 22:第一反应,不应该是合作吗?
- 观点 23:不如 sspl 直接看源,闭源的都得逼着开给你
- 观点 24:因为我无耻,所以我希望你跟我一样无耻。
- 观点 25:没有闭源的商业思维还想做闭源产品
- 观点 1:终于上道了,gpt 感觉就是玩具,推理才是真正实用的东西
- 观点 2:实际使用下来,我个人的使用场景,并没有看到 o1 的特别大的优势。反而 Claude 3 Opus 依然效果是最好的。
- 观点 3:希望工程师同行们可以指教我的看法是否正确,因为这方面我的掌握还不够。我个人认为是不是他们在跨区域 “适配数据” 所谓的思考就是单纯的 “数据内容匹配”!如果 open ai 说他可以独立思考那我个人认为,这种能力未来不好说但是现在并不存在!是不是又是个大忽悠,炒股票吹泡泡的套路。哈哈
- 观点 4:AI 本质就是信息压缩,那么你相信 md5 可逆吗,反正我不信它
程序员梗图
END
References
https://www.oschina.net/news/311730/openai-o1
https://www.oschina.net/news/311774/docker-november-2024-updated
https://t.cj.sina.com.cn/articles/view/2118746300/7e4980bc02001h73q
http://weibo.com/1871474290/OwL5iplDT
https://weibo.com/6974787068/OwHkTCeUr
https://weibo.com/1873355712/OwHoRlzFZ
https://weibo.com/1762253415/OwGhAbWxR
https://weibo.com/1233486457/OwHkP4N0M
https://www.jfdaily.com/news/detail?id=795582
https://finance.sina.cn/2024-09-13/detail-incnyivy5830670.d.html
https://t.cj.sina.com.cn/articles/view/7310786248/1b3c1bec801901mol4
https://finance.sina.com.cn/roll/2024-09-13/doc-incnyivw9120216.shtml
https://www.thepaper.cn/newsDetail_forward_28718832
https://k.sina.cn/article_1654203637_629924f5020012hi0.html
https://github.com/o2sh/onefetch
https://mp.weixin.qq.com/s/TbbDsD4PNK6ttCvFAELxSg
https://mp.weixin.qq.com/s/4k5qIVcSDL2F5tVDBW3OUg
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享
极速车坛 2024-12-16
谷易电子测试座 2024-12-16
大忠电子 2024-12-16
有度即时通 2024-12-16