欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.7.12省流概览
-Facebook 开源 C++ 框架 Ocean
-蚂蚁集团开源 EchoMimic:支持为人像照片对口型
-程序员起诉微软、GitHub 和 OpenAI 有了后续
-低成本的开源 AI 智能眼镜
-多模态 Agent 框架 - OmAgent 开源
-类似 ChatGPT 且适用于苹果设备的客户端
-谁才是大模型 “四小龙”?
-大模型玩具,AI 硬件的第一个突破口
-苏妈掷 48 亿现金吞下 AI 模型公司,英伟达有的 AMD 也要有
今日要闻
Facebook 开源 C++ 框架 Ocean:用于计算机视觉和增强现实
Ocean 是 Facebook 内部用于计算机视觉 (CV) 和增强现实 (AR)应用程序开发的开源 C++ 框架。
Ocean 主要使用 C++ 编写,且不依赖于特定平台,用于执行各种任务,包括计算机视觉、几何、媒体处理、网络和渲染。
蚂蚁集团开源 EchoMimic:支持为人像照片对口型、生成肖像动画视频
EchoMimic 具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出 “对口型” 一般的效果。
英伟达开源混合 Mamba-Transformer 视觉骨干架构
英伟达公开了 MambaVision 的 PyTorch 实现:混合 Mamba-Transformer 视觉骨干。MambaVision 采用分层架构,同时使用自关注(self-attention)和混合模块。
视觉骨干架构(Vision backbone)是视觉网络中用来提取特征的部分,在获取分析内容后,利用提取的特征完成各种任务,比如图像分割、目标检测等。
程序员起诉微软、GitHub 和 OpenAI 有了后续:法官驳回大部分索赔要求
2022 年 11 月,一群程序员对微软、GitHub 和 OpenAI 提起集体诉讼,指控 GitHub Copilot 违反版权法,在没有适当归属或遵守开源许可的情况下使用了他们的代码。在当时,这被视为可能改变生成式 AI 行业游戏规则的事件,但后来情况发生了变化。
7 月 5 日,法官 Jon Tigar 对原告的又一批索赔做出了裁决。总体而言,GitHub、微软和 OpenAI 都取得了胜利。三项诉索赔要求被驳回,只有一项获准继续审理。根据微软和 GitHub 律师的统计,目前总共只剩下两项指控。
今日观察社交观察
奔跑了五年,就为做一件难而正确的事,继续奔跑!
五年前的今天,我做了一艰难的决定,将开发了两年多的时序大数据处理平台 TDengine 的核心代码全部开源。没想到的是,TDengine 开源后迅速引起了开发者的高度关注,在 GitHub 全球趋势排行榜上多次排名第一。截止到今天,TDengine 在 GitHub 上的 Star 已经超过 23k, Fork 数超过 4.8k, 在全球检测到的安装实例数超过 56 万,遍布全球 60 多个国家和地区。
这些数字让我这个年过 50 但仍然冲在 coding 第一线的老程序员兴奋不已,因为有人 Star、有人用,它说明我们没日没夜开发的代码,给大家带来了价值。海量的用户群,是对一个程序员工作的最大回报。今天借开源五周年之际,回顾一下 TDengine 的整个发展旅程,与众多的开发者和创业者分享。
- 微信爱倒腾的程序员
低成本的开源 AI 智能眼镜
一款开源的低成本的 AI 智能眼镜,成本仅需 25 美元(国内的替代品物料可以做到百元左右),就可以将普通的眼镜升级成 AI 智能眼镜。它支持录制视频、识别物体和翻译文本等功能,但需要与电脑配合使用,暂不支持在镜片上显示内容。
GitHub:
github.com/BasedHardware/OpenGlass
- 微博林亦LYi
类似 ChatGPT 且适用于苹果设备的客户端
Enchanted 是一个开源的、兼容 Ollama 的优雅 macOS/iOS/visionOS 应用程序,适用于使用 Llama 2、Mistral、Vicuna、Starling 等私有托管模型。它本质上是一个 ChatGPT 应用界面,可以连接到您的私有模型。Enchanted 的目标是提供一个产品,能够在 iOS 生态系统(包括 macOS、iOS、Watch 和 Vision Pro)中,实现无过滤、安全、私密和多模态的使用体验。
项目地址:
github.com/AugustDev/enchanted
- 微博宝玉xp
多模态 Agent 框架 - OmAgent 开源
OmAgent 是一个多模态智能体系统,专注于利用多模态大语言模型能力以及其他多模态算法来做一些有趣的事。OmAgent 项目包含一个专为解决多模态任务而设计的轻量级智能体框架 omagent_core。项目利用这个框架搭建了超长复杂视频理解系统 ——OmAgent,当然你可以利用它实现你的任何想法。
项目:
github.com/om-ai-lab/OmAgent/blob/main/README_ZH.md
论文:
arxiv.org/abs/2406.16620
- 微博黄建同学
媒体观察
智能汽车亟待系好网络 “安全带”
自动驾驶技术产业化进程正在加速。作为人工智能赋能汽车业的典型应用场景,自动驾驶既是汽车业变革的明确方向,又是数字经济与实体经济深度融合的新赛道,也是发展新质生产力的重要领域。在惊叹 “自动驾驶已经进化到这种程度” 的同时,更应关注的是自动驾驶技术的安全性,是我国 “车路云一体化” 技术路线带来的产业机会。
-经济参考报
谁才是大模型 “四小龙”?
有一种说法是,智谱 AI、月之暗面、百川智能、面壁智能,这四家公司是新的 “四小龙”,在 6 月中旬举办的 2024 智源大会上,四位 CEO 首次同台,“四小龙” 的说法就传开了。
还有人说中国有 “大模型五虎”:百川智能、智谱 AI、月之暗面、MiniMax、云从科技。这里边把面壁智能剔除了。
-定焦
专访北京超算:国产芯片 15 天左右可跑通大模型,高端算力仍需各方努力
算力与数据,是支撑超大规模训练模型发展的两大基础设施。面对全球追逐大模型热潮,高端 AI 芯片短缺,算力问题也成为各行业实现人工智能普惠的最大难点。
-红星资本局
AI 算力价格调查:价格回归下的供需平衡术
需求高企的同时,行业也在阶段性发生变化。从国内市场来看,今年以来,随着国内对算力供需关系平衡的预期,部分算力价格开始松动。一方面,有供应链的消息称,英伟达为了吸引客户,将 H20 单卡价格从 12.5 万下降至 10 万左右;另一方面,从 AI 服务器角度来看,当前也存在一定的价格回调。
-21世纪经济报道
大模型玩具,AI 硬件的第一个突破口
在硬件中搭载大模型的思路,并不难想到,几乎所有的教育公司都会在产品中注入 AI,尤其是 “双减” 后,面向义务教育阶段的学科培训受限,教育硬件成为行业玩家掘金的重点。学习机、词典笔、甚至是早教机、故事机、单词卡等小品类硬件都成为各家发力的对象,内容之外,AI 就是其最大卖点。
-界面
苏妈掷 48 亿现金吞下 AI 模型公司,英伟达有的 AMD 也要有
CUDA 成功的一个因素是他们拥有一支内部研究团队,这支团队使用 CUDA 做一些创新。有时将这些创新转化为产品(如 OptiX),更多地是为了展示硬件能力以及提供实现方法……
不知道 AMD 对这次收购有何打算,但可以看到拥有一个内部的大模型团队为客户创建模型、进行基准测试并改进产品可能带来很大的价值。
-参考消息网
今日推荐
开源项目
mojolicious/mojo.js
https://github.com/mojolicious/mojo.js
mojo.js 是 Node.js 实时 Web 框架,可将它视作采用 Type 重写的 Mojolicious。mojo.js 使用了所有最新的 Java 特性,专为聚焦超媒体 (hypermedia) 的后端 Web 服务精心设计。
每日一博
探讨打造「高可用架构」秘籍
高可用性的文章多如牛毛,看得人眼花缭乱。今天,咱们换个花样,以终为始,来聊聊如何实现系统业务的高可用性这个宏伟目标。本文覆盖高可用架构设计、常见架构模式、高可用开发运维、大促高可用保障、业务高可用、COE 复盘等方面的理念和思考。
https://my.oschina.net/u/4090830/blog/11471110
开源之声
用户观点
JetBrains IDE 全系列采用新的默认 “皮肤”:即将面向所有用户提供
- 观点 1:能不能把内存占用改改,净整些花里胡哨的
- 观点 2:他用 java 内存占用再优化也好不到哪去
- 观点 3:越来越像 vs code
- 观点 4:应该说是 vscode 设计的确实好
- 观点 5:和现在的 2024.1 看不出任何区别
- 观点 6:就是默认开启新 UI 了而已。。原本是默认不开启的。
- 观点 7:赶紧把 clione nova 搞好合并进 clion 这才是正事。fleet 还没有正式版啊 还要多久
- 观点 8:不是已经合了吗?还有 nova 吗?
- 观点 9:还是喜欢 Material ui
- 观点 10:用了几天,还是不习惯
- 观点 11:rider 开大项目比 vs 还要卡,我以为 vs 的设计器已经够卡了,rider 比他还卡,不过看在 rider 代码补全机制比较优秀还是忍忍
- 观点 12:能不能便宜点
- 观点 13:我都用了 1、2 年新 UI 了,特别棒!比经典的 UI 清爽多了!很喜欢!
- 观点 14:不知道什么时候 visual studio 也能跟上,idea 这个模式开小窗口的时候很友好
- 观点 15:Fira code 字体在新 ui 里显示不太正常 字符间距格外的小
- 观点 16:新 UI 我倒是挺喜欢,新终端做的不好,用起来很卡
- 观点 17:降低了视觉复杂性,增高了操作复杂性。
程序员梗图
END
References
https://www.oschina.net/news/301682
https://www.oschina.net/news/301677/facebook-research-ocean
https://weibo.com/6105753431/OnbekbL5i
https://www.oschina.net/news/301731/github-copilot-ms-openai-dmca
https://weibo.com/1727858283/OnbAE81Uw
https://mp.weixin.qq.com/s/RW9ZmKcq64y-4FNsWp7skw
https://weibo.com/6444741184/Oncy7E2y7
https://weibo.com/5648162302/On5ESmDmO
https://ishare.ifeng.com/c/s/8b9eRg2t67i
https://k.sina.cn/article_6192937794_17120bb42020029iy6.html
https://www.21jingji.com/article/20240711/herald/7ce5468393eaadb9e88a1e57d188e627.html
https://k.sina.com.cn/article_7399555658_1b90c424a020018crm.html
https://baijiahao.baidu.com/s?id=1804338793968622355&wfr=spider&for=pc
https://t.cj.sina.com.cn/articles/view/7517400647/1c0126e4705905fgts
https://my.oschina.net/u/4090830/blog/11471110
https://github.com/mojolicious/mojo.js
https://my.oschina.net/u/4090830/blog/11471110
https://mp.weixin.qq.com/s/8UrsjXMqg1vt2HlRArLZig
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享