当前位置:首页|资讯|LLaMA|融资|编程|OpenAI

开源日报 | 龙芯3C6000流片成功;瑞士要求所有政府软件开源;Llama 3.1技术报告隐藏的干货;百川智能完成50亿元融资

作者:OSC开源社区发布时间:2024-08-01

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.7.25省流概览

-Stack Overflow 2024 年度开发者调查报告

-龙芯3C6000服务器CPU流片成功

-Node.js 支持原生运行 Type

-OpenAI 对 GPT-4o Mini 模型进行免费微调

-瑞士要求所有政府软件开源

-Mistral AI 发布 1230 亿参数 Large 2 大模型

-LLama 3 405B模型效果已经赶上目前最好的闭源模型

-正在消亡的浏览器,要靠AI大模型满血复活?

-Meta Llama3.1技术报告隐藏的干货

-2023年中国数据库市场规模74.1亿美元,占全球7.34%

-OpenAI自研芯片帝国,全揭秘!

今日要闻

Stack Overflow 2024 年度开发者调查报告

过去一年中共有 62.3% 受访者使用了 Java,其次分别是 HTML/CSS(52.9%)和 Python(51%)。在开发者 “还未尝试但明年最想尝试的编程语言” 中,Python 夺得第一,超过了 Java。此外 Python 也是正在学习编程的人中最受欢迎的编程语言,这一人群还表示,希望明年平均使用 12 种不同的语言。

龙芯 3C6000 服务器 CPU 流片成功

龙芯中科技术股份有限公司董事长胡伟武介绍,该公司在研的服务器 CPU 龙芯 3C6000 近日已经完成流片。实测结果表明,相比上一代服务器 CPU 龙芯 3C5000,其通用处理性能成倍提升,已达到英特尔公司推出的中高端产品至强(Xeon)Silver 4314 处理器水平。

Node.js 支持原生运行 Type

Node.js 合并了为 Type 添加实验性支持的 PR。根据 PR 的描述,开发者只需配置实验性 flag--experimental-strip-types就可以执行 Type 文件。

Node.js 会将 Type 代码自动转译为 Java 代码。在转译过程中,不会执行类型检查,类型会被丢弃 ——Node.js 团队称之为 "type stripping"(类型剥离)。

瑞士要求所有政府软件开源

7 月 23 日,瑞士通过了「履行政府任务电子手段使用联邦法案(EMBAG)」,要求所有公共机构披露其开发或为其开发的软件源代码,除非涉及第三方权益或安全问题。此举旨在增强政府运作的透明度、安全性和效率。

除了要求软件开源外,EMBAG 还要求发布非个人和非安全敏感的政府数据作为开放政府数据(OGD)。这种「默认双重开放」的方法标志着瑞士政府向更大开放性做转变。

OpenAI 对 GPT-4o Mini 模型进行免费微调

在 Meta 推出开源 Llama 3.1 模型之后不久,OpenAI 宣布对其 GPT-4o Mini 模型提供免费微调,允许用户免费使用额外数据训练模型,以便在特定用例中获得更高的性能。

GPT-4o mini 微调适用于 OpenAI 的 Tier 4 和 5 使用层级的开发人员,这是 OpenAI 计划中价格最高的层级。OpenAI 计划逐步将免费微调扩展到所有层级。免费微调将从现在开始持续到 9 月 23 日。

Mistral AI 发布 1230 亿参数 Large 2 大模型

继 Meta 昨天发布最强开源大模型 Llama 3.1 后,法国 AI 初创公司 Mistral AI 也加入了竞争,今天发布了全新的旗舰开源模型 Mistral Large 2。

该模型拥有 1230 亿个参数,可在单个 H100 节点上以高吞吐量运行,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下,并提供更强大的多语言支持和高级函数调用功能。

今日观察社交观察

LLama 3 405B 模型效果已经赶上目前最好的闭源模型

LLama 3 405B 模型效果已经赶上目前最好的闭源模型比如 GPT 4o 和 Claude 3.5,这算是开源届的大事,技术报告接近 100 页,信息很丰富,粗略看了一下,很有启发。这里就 LLaMA 3 的模型结构、训练过程做些解读,并对其影响、小模型如何做、合成数据等方面谈点看法。

其实 405B 的正确用法不是用来提供服务,而是用来蒸馏应用的基座模型,来提升基座模型能力。毕竟用闭源模型蒸馏成本太高了。当然,405b 中文化方面需要改进。

- 微博张俊林say

正在消亡的浏览器,要靠 AI 大模型满血复活?

只要 Web 不死,浏览器就一定不会消亡。但用户需求在变,技术也在也变,所以浏览器的演变是不可避免的。

或许,未来的浏览器会变成什么样的产品还没有定数,国产浏览器和海外浏览器都在进行相同或者不相同的探索。说到底,不只是浏览器,我们大多数人和厂商对于 AI 的应用都需要一个适应和学习的过程。

但基本可以肯定,隐私和 AI 会是浏览器未来的两大主线,前者让用户更放心地上网,后者让用户在这个信息纷杂的时代,更轻松地从大模型、从互联网获取需要的信息。

- 微信雷科技

Meta Llama 3.1 技术报告隐藏的干货

大规模模型训练面临诸多挑战,包括硬件故障和稳定性问题。

报告提到,在 54 天的快照期间,共发生 466 次作业中断,其中 419 次是意外中断。有趣的是,其中两次中断是由 "服务器机箱" 故障引起的。更令人吃惊的是,在预训练阶段,有 148 块 H100 GPU 出现故障。

报告进一步分析指出:"约 78% 的意外中断归因于已确认或疑似的硬件问题。" 这一数据揭示了大规模 AI 训练中硬件可靠性的重要性。

- 微博高飞

2023 年中国数据库市场规模 74.1 亿美元,占全球 7.34%

近日,中国通信标准化协会发布《数据库发展研究报告(2024 年)》。报告显示,2023 年全球数据库市场规模首次突破千亿美金,约为 1010 亿美元,中国数据库市场规模为 74.1 亿美元(约合 522.4 亿元人民币),占全球 7.34%。预计到 2028 年,中国数据库市场总规模将达到 930.29 亿元,市场年复合增长率(CAGR)为 12.23%。2023 年中国公有云数据库市场规模为 320.15 亿元,较 2022 年增速 46.1%,中国数据库市场规模稳步增长。

- 微博盘石

OpenAI 自研芯片帝国,全揭秘!

据 The Information 援引知情人士消息,OpenAI 一直在招聘谷歌 TPU 部门的前成员,寻求开发 AI 服务器芯片,并一直在与包括博通在内的芯片设计企业洽谈开发这款新型 AI 芯片的事宜。

去年 OpenAI CEO 萨姆・阿尔特曼(Sam Altman)决定创办一家新公司,开发和生产新的 AI 芯片,并帮助建设芯片工厂、数据中心来制造和容纳这些芯片。此后他的计划几经曲折。但有迹象表明,他打造新芯片的努力正在成形,而且是从 OpenAI 内部开始。

OpenAI 芯片团队由谷歌 TPU 前工程高级总监 Richard Ho 领导。该团队很可能会选择一家美国公司(如博通)来帮助其开发拟议的新芯片。

- 微信芯东西

假开源真噱头?Meta 再陷「开源」争议,LeCun 被炮轰 Meta 只是开放模型

Llama 3 模型并不是真正意义的开源,至少不是按照最严格定义的开源。开源意味着研究开发人员可以自由选择如何使用这些模型,不受限制。但在 Llama 3 的一些案例中,Meta 对于一些许可的授权进行了限制。

例如,Llama 模型不能用于训练其他模型;拥有超过 7 亿月活跃用户的应用程序开发人员则必须向 Meta 申请特殊许可证。

许多学者和研究机构也注意到了对于「开源」一词的滥用情况,许多标榜为「开源」的大模型都存在重大限制,「真假开源」存疑。

- 微信新智元

媒体观察

人形机器人产业 “火热” 背后的冷思考

随着人工智能技术逐步成熟和机器人产业快速发展,越来越多人形机器人逐渐进入公众视野。面对人形机器人的 “热”,行业人士表示应有冷思考,对于人形机器人行业的 “一高五难” 需有清楚认知,推动人形机器人发展需以应用驱动研究。

-媒体滚动

《鸿蒙 2030 白皮书》解读:塑造下一代智能终端体验与产业生态

《鸿蒙 2030 白皮书》认为,在万物智联时代将为操作系统带来服务智能化、体验空间化,终端多样化三大机遇。鸿蒙 2030 的愿景就是致力于以用户体验为中心,打造全场景智能操作系统,携手生态伙伴为用户带来更美好的全场景智能生活,共筑万物智联的鸿蒙世界。

-环球网

杭州市人民政府办公厅关于印发支持人工智能全产业链高质量发展若干措施的通知

鼓励企业开展算力关键技术研发攻关,市级按照有关政策给予支持。鼓励企业承担国家、省重点研发任务,加速形成重大科研成果,对符合政策规定的项目按国家、省实际到账资助经费的 25% 给予资助,资助金额不超过 500 万元。

-杭州新天地

百川智能完成总额 50 亿元 A 轮融资,估值达 200 亿元,阿里、腾讯、小米等投资

这意味着,国内头部的大模型初创企业仍在进行激烈的融资暗战,目前 MiniMax、月之暗面、智谱 AI 等公开估值均超 200 亿元,且头部 VC、科技大厂以及国资产投等主流基金都已入场。腾讯、阿里还同时投资了智谱 AI、月之暗面和 MiniMAX,阿里还尤其激进,押注了目前市面上最受关注的 “大模型五虎”。

-搜狐科技

华为吸纳人工智能领域 “天才少年” 加速 AI 研发布局

从此次发布的内容看,华为对 “天才少年” 的要求不限学校、不限专业、不限学历,但需要在数理化、计算机、人工智能等相关领域有特别建树并有志成为技术领军人物。

华为还表示,将为 “天才少年” 提供世界级挑战课题、大牛导师、全球化的平台和资源。

-证券日报

北京上半年累计上线大模型 71 款,占全国四成以上

2024 年上半年,北京市创新和高技术产业表现强劲,特别是在人工智能领域取得了重要进展,全市数字经济的增加值同比增长 7.8%,其中信息服务业实现增加值 4944.6 亿元,同比增长 12.4%,拉动 GDP 增长 2.6 个百分点。

-新京报

提前曝光 Llama 3.1,Meta 为什么想做「大模型界 Linux」?

比肩世界上最强大模型的 Llama3.1 开源,社交平台 X 上,很多人将这一事件视为历史、拐点、史诗级时刻,这意味开源、闭源之间的差距进一步缩小乃至反超,还意味着开发者从此有了一个免费的最强基座模型在手。

-极客公园

AI 生成作品版权算谁的?番茄小说 AI 训练协议惹争议

多位番茄小说作者在社交平台晒出番茄小说发出的 “AI 训练补充协议” 通知,内容显示,“甲方(番茄小说)可将签约作品的全部或部分内容及相关信息 (如作品名称、简介、大纲、章节、人物、作者个人信息、封面图等) 作为数据、语料、文本、素材等用于标注、合成数据 / 数据库建设、AI 人工智能研发、机器学习、模型训练、深度合成、算法研发等目前已知或未来开发的新技术研发 / 应用领域。”

-第一财

今日推荐

开源项目

EmbarkStudios/rust-gpu

https://github.com/EmbarkStudios/rust-gpu

Rust-GPU 是面向 GPU 编程的开源项目,目标是使 Rust 成为 GPU 着色器开发的 “一等公民” 编程语言和生态系统。

每日一博

得物 App 弱网诊断探索之路

本次实现的是被动弱网诊断,也就是不主动发起探测请求,被动采集 App 内的全部网络请求,再根据一定在策略计算出用户网络环境。相对于主动探测,被动探测不会浪费用户资源。尤其是在吞吐量计算方面,主动探测不仅会消耗用户流量,还可能会对正在进行中的用户网络请求产生影响。而且当用户网络环境不佳时,负向影响更加严重。

https://my.oschina.net/u/5783135/blog/13722371

开源之声

用户观点

“开源模型是智商税” v.s. “开源 AI 是前进的道路”

  • 观点 1:让他搞 AI 别用开源的编译器、操作系统、开发语言、训练推理框架等等试试
  • 观点 2:百度这么多年闭源都闭出了啥垃圾?闭门造车还好意思 diss 别人,不知道自己的搜索引擎被上亿人 diss 吗?别再击穿道德底线了… 如果还有底线的话
  • 观点 3:你中文的可信数据有多少,简直去污染模型
  • 观点 4:个人认为不开源的模型肯定比开源模型强,因为有些公司会拿开源模型稍微优化一下,再绕过开源协议,这样就变成闭源的了,瞎口嗨的,勿喷
  • 观点 5:百度和 meta 说的完全是两个事......
  • 观点 6:先不说开源模型和闭源模型比性能到底谁高谁低 开源是智商税的话 你 robin 的文心一言敢说代码里一点开源的成果都没用到吗?你只要用了就算自己打自己脸吧?
  • 观点 7:开源都不要钱哪来的税?
  • 观点 8:自己在 ollama 上用阿里的 Qwen2 都感觉比百度的文心一言舒服。
深圳移动:线下解封 “停机” 需社保连续缴纳 6 个月以上
  • 观点 1:实名制这么久,骚扰电话一个没少
  • 观点 2:有点管的太多了,实名制就行了呗
  • 观点 3:评论区里的,移动公司的行为上升到社会问题是吧?
    • 观点 4:这还真不是上升到社会问题,而是深圳很多都需要社保卡的,新办理银行卡转账限额为 0,手机卡...... 见微知著
  • 观点 5:直接工信部投诉就完事了
  • 观点 6:银行开卡要手机入网半年以上
  • 观点 7:这是因为号码太好,值钱了,所以被人盯上了
  • 观点 8:以前打电话人家还要猜你是谁,现在直接喊名字。
  • 观点 9:没手机号也找不到工作啊
  • 观点 10:问一下:没在深圳交社保的是不是就不能在深圳办理移动卡
  • 观点 11:难怪说深圳移动不属于广东省
  • 观点 12:大家可能误会移动公司的要求了,这个被封禁,应该是出现一些恶意行为。

程序员梗图

活动推荐

END

References

https://www.oschina.net/news/303827/so-developer-survey-2024

https://www.oschina.net/news/303823

https://mp.weixin.qq.com/s/vNCBiJ5lzBfZlJpGXT-Liw

https://www.oschina.net/news/303792/openai-free-fine-tuning-gpt-4o-mini

https://www.oschina.net/news/303781/switzerland-requires-all-gov-software-to-be-open-source

https://www.oschina.net/news/303788/mistral-large-2407

https://mp.weixin.qq.com/s/dbptTBT2SzGL9sY_w_X2AQ

https://weibo.com/1064649941/Op4uE0l4z

https://mp.weixin.qq.com/s/Q2ihPyYmkdt-FuzslKAJ_A

https://weibo.com/1233486457/Op47O0sAi

https://weibo.com/1914023002/Op15A8l4z

https://mp.weixin.qq.com/s/PvjvjMAP3_blAtpV97yuZA

https://finance.sina.com.cn/tech/roll/2024-07-24/doc-incffscy7104045.shtml

https://3g.k.sohu.com/t/n808693861

https://baijiahao.baidu.com/s?id=1805457791910004613&wfr=spider&for=pc

https://cj.sina.com.cn/articles/view/2311077472/89c03e60020027g18

https://3g.k.sohu.com/t/n808679288

https://mp.weixin.qq.com/s?__biz=MjM5Nzc3ODcxMg==&mid=2657573418&idx=2&sn=215cc0938e00d1aa71862fdaae00a9e9&scene=0

https://tech.huanqiu.com/article/4IkbHSWS8Do

https://finance.sina.com.cn/jjxw/2024-07-25/doc-incfhpit9042511.shtml

https://my.oschina.net/u/5783135/blog/13722371

https://github.com/EmbarkStudios/rust-gpu

https://mp.weixin.qq.com/s/KSfT74hdrHNMyqS7Ww2Tnw

https://mp.weixin.qq.com/s/rTy1sp9BGuAN0vzGU_aMHg

最后,欢迎扫码下载「开源中国 APP」

阅读海量技术报告、程序员极客分享


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1