欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.7.5省流概览
-李彦宏:开源模型是智商税,智能体正在爆发
-MySQL 9.0 “创新版” 已支持向量
-Java 工程师的 Python 指南
-Windows 下的 GUI 开发
-用 150 行 C 代码超越 NumPy 的矩阵乘法性能
-边学 AI 边赚钱的 GitHub 项目
-有趣的人形机器人争相登场
-上海 AI lab 开源多模态 LLM
今日要闻
李彦宏:开源模型是智商税,智能体正在爆发
李彦宏认为,开源其实是一种智商税。“当你理性地去想,大模型能够带来什么价值,以什么样的成本带来价值的时候,就会发现,你永远应该选择闭源模型。今天无论是 ChatGPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”
谈及 “AI 超级应用什么时候出现” 时,李彦宏表示,“不是说一定在等待一个超级应用的出现”。他认为,在基础模型之上,应该能够诞生数以百万计的各种各样的应用。“如果仅仅是从 0 到 1,你可能会希望出现某几个 Super APP,也就是几个公司从中受益。但是今天,几乎各行各业所有的公司,被大模型加持之后,它都能受益。这种影响力,对于整个社会、对于人类来说,无疑是更大的。”
李彦宏称,智能体代表着 AI 时代的未来趋势。“智能体正在爆发,只是现在基数还比较小,大家的体感没有那么强烈。” 基础模型需要靠应用才能显现出价值,智能体是一个几乎 “放之四海而皆准” 的基于大模型的应用,由于它门槛足够低,可能你连编程都不用,就可以做出一个效果不错的智能体。“让更多人进来,他们发挥聪明才智,指不定哪条路跑通了,它就是一个 Super APP。”
MySQL 9.0 “创新版” 已支持向量,为何甲骨文却 “偷偷摸摸” 地宣布?
对于 MySQL 9.0 “创新版”,最值得关注的新特性莫过于支持向量数据类型,字段类型名称为VECTOR,可以使用
to_vector/string_to_vector/from_vector/vector_dim 等函数操作向量数据。
下面示例是使用 CREATE TABLE 创建包含 VECTOR 列的 InnoDB 表:
mysql> CREATETABLEv1(c1 VECTOR(5000));
QueryOK, 0rowsaffected(0.03sec)
操作向量的相关函数介绍:
在今日的 2024 上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展:近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次;阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。
周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”
腾讯混元 DiT 开源 6G 小显存版本,支持 Kohya 训练
腾讯混元文生图大模型(混元 DiT)宣布开源小显存版本,仅需 6G 显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与 LoRA、ControlNet 等插件,都已适配至 Diffusers 库;并新增对 Kohya 图形化界面的支持,让开发者可以低门槛地训练个性化 LoRA 模型;同时,混元 DiT 模型升级至 1.2 版本,在图片质感与构图方面均有所提升。
此外,腾讯宣布混元文生图打标模型” 混元 Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。
今日观察社交观察
《Java 工程师的 Python 指南》
作者是一名前端工程师,受人工智能的影响,决定系统性地学习 Ptyhon,并将其学习过程整理成这本书。
涵盖了从 Python 环境安装到项目开发的方方面面,同时会通过案例对比 Java 和 Python 语言的异同,帮助 Java 工程师快速掌握 Python 语言。
GitHub:
github.com/luckrnx09/python-guide-for-java-engineers
- 微博GitHubDaily
用 150 行 C 代码超越 NumPy 的矩阵乘法性能
“这篇博文是我尝试在 CPU 上实现高性能矩阵乘法的结果,同时保持代码简单、可移植和可扩展。该实现遵循 BLIS 设计,适用于任意矩阵大小,并且在针对 AMD Ryzen 7700(8 核)进行微调后,性能超过了 NumPy(=OpenBLAS),在各种矩阵大小上实现超过 1 TFLOPS 的峰值性能”。
文章地址:
salykova.github.io/matmul-cpu
- 微博蚁工厂
Windows 下的 GUI 开发
开发 Windows GUI 应用真是让人头疼,先梳理一下需求:
- 仅支持 Windows
- 允许商业用途
- 易于样式化,包括暗模式
- 结果是一个无依赖或最小依赖的单一.exe 文件,大小不超过 40MB
- 编写 GUI 部分不应比实际功能花费更多时间
然而目前市面上的常见库体验并不好:
1. WinUI 3:支持现代 Windows 组件和样式化,但分发时依赖繁多,难以实现单一可执行文件。
2. Win32 / MFC:高可移植性,但样式化困难,需要大量自定义绘制代码。
3. Qt:功能强大,易于样式化,但动态链接依赖大,静态链接需开源或购买商业许可证。
4. wxWidgets:学习曲线平缓,可静态链接成小文件,但样式化受限。
5. hikogui:新兴库,使用 Vulkan 后台,样式化方便,但编译复杂且稳定性差。
6. Sciter:类似 Electron,支持 HTML/CSS 写 GUI,但渲染效果一般,某些元素无法自定义。
7. WinForms / WPF:建议使用其他前端技术并加载 C++ 功能模块,理论上可实现单一可执行文件,但依然有些复杂。
经过多方尝试,发现 Dear ImGui 最适合简单的应用。虽然设计复杂 UI 时有些局限,但符合大部分需求。ImGui 是即时模式 UI,需要使用 DirectX 进行渲染,但其结果只有 500KB 大小,不需要额外安装任何依赖。
- 微博量子位
上海 AI lab 开源多模态 LLM:InternLM-XComposer-2.5
详细的模型特点:
长上下文处理:IXC-2.5 原生支持 24K 标记的输入,可扩展到 96K, 能处理超长文本和图像输入。
多样化视觉能力:支持超高分辨率图像理解、细粒度视频理解和多轮多图对话。
其他功能:可以生成网页和高质量文章,结合了文本和图像。
模型架构:包括轻量级视觉编码器、大语言模型和部分 LoRA 对齐。
测试结果:在 28 个基准测试中,16 项超过开源模型,16 项接近或超过 GPT-4V 和 Gemini Pro。
模型下载:
https://huggingface.co/internlm/internlm-xcomposer2d5-7b
- 微博歸藏的 AI 工具箱
边学 AI 边赚钱的 GitHub 项目
从 2023/3 月开始用 chatgpt 和 mj 等 ai 开始,我们已经陆续开发了几个 ai 项目。最近,帮助公司内部文档查询的基于 llama3 的 RAG 项目也开始部署了。而在这个过程中,我们才慢慢明白 LLM 是什么,能力的边界在哪里。哪些人是靠谱的,又有哪些人在胡说。
而今天 ai device 的热潮慢慢升温,ai 开始结合硬件。学习的最佳方式,仍然是参与项目。前一段时间介绍的 friend 这个硬件项目就非常有意思。他不但开源了,而且会在 GitHub issues 里面用悬赏。
比如这个 issues 390 ,你解决了就拿走 100 美金。
https://github.com/BasedHardware/Friend/issues/390
- 微博李楠或kkk
媒体观察
这些有趣的人形机器人争相登场,它们离实际应用有多远?
多位业内人士表示,倘若机器人未来大规模应用,从制造业到服务业,真正走进公众生活、走近百姓身边,陪护老人、陪教儿童等,还有许多 “软硬件” 待升级,包括看得见的零部件灵敏度、安全性等,看不见的数据隐私、算法偏见、伦理道德等,都需要有更全面、更优化的解决方案,保障新技术、新产品的安全和可持续发展。
-新华社
国内首款人形机器人公版机发布,百亿人形机器人产业基金正在弦上
为何发布公版机?很大程度上是由于目前人形机器人产业面临的一系列共性问题。比如硬件层面同质化重发研发,中小企业创新难;软件层面动力学研发周期长,容易摔倒,稳定性不够。
国地共建中心首席科学家江磊对 21 世纪经济报道记者表示,“手机行业曾经经历了从公版机,到目前手机大厂的发展模式。公版机,也是促进人形机器人快速标准化,通用化最好的方式。等下半年,共创验证没有问题,会择机完全开源。”
-21世纪经济报道
硅基流动完成近亿元天使 + 轮融资 国产大模型 “补足弹药” 混战升级
今年以来,大模型赛道热闹非凡:一方面国内大模型创业公司打响 “价格战”;另一方面,OpenAI 宣布终止对中国开发者提供 API(应用程序接口)服务也引发了国内大模型争相推出 “迁移计划”。与此同时,资本也正在向头部企业进一步聚集。
-每日经济新闻
开放是 AI 风险的唯一解
AI 的风险底层是技术问题,由于其决策过程常因技术黑箱而显得神秘莫测,这种不透明性不仅削弱了公众的信任,还为技术主导者的滥用和误判提供温床。推动 AI 技术的开放势在必行,让更多人能够深入了解 AI 运作机制。
-北京商报
大模型落地考,难点在哪里?
所以,大模型的能力在多模态方面的突破,会带来 AI 的普惠,为 AI 开启更多的可能性。原来的投入产出是一个金字塔型结构,即投入很大,但是收益很小;只有将它变成一个倒金字塔结构,这样才能真正放大它的价值。
新技术在催生新的产业变迁的同时,也会构建一个新的价值链,AI 产业也是如此,从单点爆发到各行业的全方位突破,AI 所创造的价值也将是指数级的。
-光锥智能
大模型想赚钱,先过这七道难关
中关村科金 CTO 李智伟博士最近发现,大模型商业闭环,正在被提到很重要的位置。
不同于过去 20 年间中国 IT 行业的发展,可以通过烧钱来快速积累用户,靠估值和广告实现商业变现;大模型时代,投资市场愈加理性,正在倒逼业界加快实现商业闭环。
-数智前线
工信部赵志国:开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台
工业和信息化部新闻发言人、总工程师赵志国在 “推动高质量发展” 系列主题新闻发布会上表示,生态的打造与构建对信息通信业发展极其重要。目前,我国成立了开放原子开源基金会,开放鸿蒙、开源欧拉等优质开源项目正在走向国际舞台。
-通信世界网
今日推荐
开源项目
wa-lang/wa
https://gitee.com/wa-lang/wa
凹语言(凹读音 “Wā”)是 针对 WASM 平台设计的通用编程语言,同时支持 Linux、macOS 和 Windows 等主流操作系统和 Chrome 等浏览器环境,同时也支持作为独立 Shell 脚本和被嵌入脚本模式执行。
每日一博
VLMs 多模态大模型当下进展与思考
在过去的一年中,VLMs 技术取得了飞速发展。本文旨在对这些技术进步进行梳理与思考,但将避免深入具体的论文细节,而是用简明扼要的方式介绍每篇研究的核心思想。
https://my.oschina.net/u/4662964/blog/11323265
开源之声
用户观点
Visual Studio Code1.91 发布
李彦宏:没有应用,基础模型不值一提
- 观点 1:graph 终于出现了,希望搞的更牛批点,比 webstorm 的 git 图形化还好。大家都去点个赞,加快点速度,让 vscode 的 git 更好用!!! github----com/microsoft/vscode/issues/179053
- 观点 2:mac 更新完,VSC 起不来了
- 观点 3:目前我用 Git Graph 插件,不过几年没更新了
- 观点 4:没有独立的 git 提交界面
- 观点 1:比没有应用更可怕的是没有下限,你的文心一言会不会骗大家去莆田系医院呢?
- 观点 2:现在有什么问题还是要 ChatGPT google。某些搜索引擎搜索出来的东西不能看啊。
- 观点 3:为了吃入,从一个极端到另一个极端?
- 观点 4:可以预测的未来,百度越是缺钱,百度搜索体验越差,这简直是一个恶性循环,百度搜索结果前两页全是广告,名副其实的广告搜索。
- 观点 5:说的也没错,现阶段 AI 就是适合专向专干。
- 观点 6:起个大早,赶个晚集。
- 观点 7:陆奇哭晕在厕所里
程序员梗图
END
References
https://mp.weixin.qq.com/s/CUoM87LRvlw53M_NxOaiDA
https://mp.weixin.qq.com/s/SoetAIDZAcebpOvAafJRcA
https://www.pingwest.com/w/296430
https://mp.weixin.qq.com/s/FCpDdDJ2j5_NL_XDIkmHMw
https://weibo.com/5722964389/Om6N3uysr
https://weibo.com/2194035935/OlYMEdmyR
https://weibo.com/6105753431/OlEPf1V9P
https://weibo.com/6182606334/Om7QW71C4
https://weibo.com/1645215240/Om1sUw5ad
http://www.cww.net.cn/article?id=591771
https://mp.weixin.qq.com/s?__biz=MzkwNDMyOTA1NA==&mid=2247490150&idx=1&sn=47c85993df46c11325ecb595078ff90b&chksm=c089f857f7fe7141c708fbd77dd466526cc5804866a8269ce1377f7165e1889974075dd9d6e7#rd
https://mp.weixin.qq.com/s?__biz=MzkyNDIxMDQ1OA==&mid=2247496430&idx=1&sn=8b54eeef094fadbd254afc99d1e0e918&scene=0
https://www.yidianzixun.com/article/0viEg49B
https://finance.sina.cn/2024-07-04/detail-incayqcc8292865.d.html
https://finance.sina.com.cn/roll/2024-07-05/doc-incazvws6719363.shtml
https://3g.k.sohu.com/t/n803341037
https://gitee.com/wa-lang/wa
https://my.oschina.net/u/4662964/blog/11323265
https://www.oschina.net/news/300318/vs-code-1-91-released
https://www.oschina.net/news/300387
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享