欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.8.7省流概览
-“苹果牌AI”提示词就这?
-TIOBE 8 月榜单:Python 霸权地位已无可争议
-李开复旗下 AI 公司「零一万物」完成数亿美元融资
-Windows 11 市场份额首次突破三成
-人人影视创始人致歉
-这款开源 PHP 应用服务器看着有点新潮
-开源垃圾就是这么来的
-贾扬清的 Lepton AI 推出了针对开源 LLM 的实时语音生成
-面壁开源最强端侧多模态LLM:MiniCPM-V 2.6
-“有关Arm和X86的一些讨论,是错误的”
今日要闻
“苹果牌 AI” 提示词就这?
苹果拥有全球最优秀的编程人才和强大的研发实力,然而它在 Apple Intelligence 针对各种智能应用设计的提示词却给人一种 “草台班子” 的味道。
近日,网友在 macOS 15.1 Beta 1 中发现了 Apple Intelligence 后端使用的 Prompt。从下图可以看到,苹果解决 LLM 幻觉问题是在提示词里面加一句 “Do not hallucinate”(不要产生幻觉)—— 非常 amazing!
TIOBE 8 月榜单:Python 霸权地位已无可争议
本月,Python 的份额首次超过 18%。而上一次超过 18% 的语言是 2016 年 11 月的 Java,Java 也是有史以来排名最高的语言:2001 年 6 月为 26.49%。
目前,排名第二的 C++ 现在正好落后 Python 8%。纵观以往的数据,第一名和第二名之间的最大差距出现在 2016 年 11 月,当时 Java 领先 C 语言 9.55%。
TIOBE CEO Paul Jansen 点评称,“总而言之,Python 的霸权地位已无可争议。下一步,Python 很有可能成为有史以来最流行的编程语言。是否有任何新语言有望很快接近 Python?有可能的竞争者 Rust 和 Kotlin 正在迅速接近 TIOBE 指数前 10 名,但它们还需要很长时间才能真正威胁到 Python。”
李开复旗下 AI 公司「零一万物」完成数亿美元融资
根据 36 氪的独家报道,李开复创办的 AI 大模型独角兽公司「零一万物」已经完成新一轮融资,金额达数亿美元。知情人士表示,此轮融资参与方包括某国际战投、东南亚财团等多家机构。
「零一万物」成立于 2023 年 5 月,由创新工场董事长、前微软全球副总裁李开复创立。核心团队成员来自谷歌、微软、IBM、百度等公司。
如今的 “大模型六小虎”(智谱 AI、零一万物、百川智能、MiniMax、月之暗面、阶跃星辰),正以惊人的速度,跨过 200 亿元的估值大关。
Windows 11 市场份额首次突破三成
2024 年 7 月,Windows 11 达到了一个重要里程碑:自 2021 年 10 月发布以来,其市场份额首次突破了三成。
根据 Statcounter 的统计,2024 年 7 月的 Windows 桌面操作系统中,Windows 11 的比例达到了 30.82%,一个月内增长了 1.08%,比去年 7 月增长 7.17%。
今日观察社交观察
开源垃圾就是这么来的
- 微博有个梨GPT
贾扬清的 Lepton AI 推出了针对开源 LLM 的实时语音生成
传统方法的集成语音功能涉及将文本发送到 LLM,等待响应,然后通过文本转语音(TTS)服务进行处理。传统方法会有明显的延迟、音频错位或不自然的停顿等用户体验问题。
Lepton AI 的解决方案将 LLM 和 TTS 功能集成到一个统一的服务中,主要特点:
- 与任何主要开源 LLM 无缝集成,包括 Llama3.1-8B、70B 和 405B
- 以高达 10 倍的 TTFA(首次音频时间)速度超越传统方法
- 流畅、可定制的对话,几乎没有停顿
介绍链接:
https://blog.lepton.ai/voice-mode-comes-to-lepton-llm-apis-a5ff3db8c7bf
- 微博i陆三金
面壁刚刚开源了最强端侧多模态 LLM:MiniCPM-V 2.6
8B 参数,在单图像、多图像和视频理解方面超越了 GPT-4V,支持在 iPad 等终端设备上进行实时视频理解
特点:
1、性能:在单图像理解方面超越 Gemini 1.5 Pro 和 GPT-4o mini(OpenCompass 上),在多图像理解方面超越 GPT-4V(Mantis-Eval 上),在视频理解方面达到端侧 SOTA,超越 GPT-4V(Video-MME 上)
2、多模态输入:支持图像、视频和文本等多种输入,提供高质量的文本输出
3、具有较强的 OCR 能力、可信行为、多语言支持和端侧部署能力,并通过高效的 token 密度提升了推理速度、首 token 延迟、内存使用和功耗
- 微博AIGCLINK
今天两条重要信息,可以放在一起解读
今天两条重要信息,可以放在一起解读。因为这两项重要进展凸显了一个共同趋向:个人用户的手机和电脑,可以开始拥有媲美云端的图片 - 视频的理解和生成能力。关键词是端侧、开源、多模态。而且可喜的是,取得进展的是两家国内企业。
- 微博胡延平EarthRambler
“有关 Arm 和 X86 的一些讨论,是错误的”
换句话说:无论是 x86 还是 ARM ISA,实现市场期望的功能和性能都有‘典型成本’。因此,如果增加复杂性会降低任何 ISA 的功耗,那么就变成了一场争夺哪组设计选择能够产生最佳性能 / 功耗 / 面积 (PPA) 以满足消费者期望的战斗。
- 微信半导体行业观察
媒体观察
“去年投 AI,今年投简历”
尽管 AI 技术被广泛认为是未来的关键驱动力,但现实情况是,许多 AI 创业项目并没有解决市场的真正痛点,导致资金供应与项目需求之间出现了不匹配。投资者开始更加理性地评估 AI 项目的市场潜力和实际应用价值。与此同时,大模型项目因其技术壁垒和广泛的应用前景而更易获得资本青睐。
-融中财经
OpenAI “偷录” YouTube 视频训练 AI?一百多名创作者决定集体起诉
当地时间 8 月 2 日,一位 YouTube 主播代表在美国加利福尼亚州北区地方法院正式递交了集体诉讼文件,指控 OpenAI 擅自转录了数百万个 YouTube 视频来训练大模型,目前有超过 100 人参与该集体诉讼。截至发稿,OpenAI 对该集体诉讼没有发表回应。
起诉书写道,创作者们拥有 YouTube 视频的所有权,OpenAI 的行为违反了 YouTube 的平台条款,并且从创作者们的损失中获得了不正当利益,要求 OpenAI 赔偿超过 500 万美元。
-21世纪经济报道
头部银行谨慎推进大模型,新一代核心系统还在攻坚期
目前,大模型在金融业的应用,基本上是代码开发、运维、交互式数据分析、营销工具、保险报价等。因为应用场景有限,一位大模型厂商负责人表示:"没想到代码助手在银行变得如此突出。"
除了大行,从金融体系的步伐看,一些城商行或合资银行与大行不通,节奏要更快一点。"投入几百万元,就能解决一个实际问题。"
-数智前线
李飞飞亲自撰文,数十名科学家签署联名信,反对加州 AI 限制法案
在创新的热土硅谷,李飞飞、吴恩达等 AI 科学家正在与监管部门展开一场关于安全与创新的拉锯战。
这场拉锯战的核心是一个名叫 SB-1047 的法案。该法案的全称是「Safe and Secure Innovation for Frontier Artificial Intelligence Act(《前沿人工智能模型安全创新法案》)」,试图为高风险的 AI 模型建立明确的安全标准,以防止其被滥用或引发灾难性后果。
-机器之心
无一大模型及格!北大、通研院提出超难基准,专门评估长文本理解生成
北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估 LLMs 对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。
结果不评不知道,一评估发现这些模型在复杂的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。
-量子位
欧洲版 OpenAI CEO:开源模型没有任何风险,我只看到了好处
Mensch 表示,开源模型没有任何风险,他只看到了好处;
开源模型是一个中立的工具,可以被用来做任何事情;
人们没有因为你可以用 C 语言制作恶意软件就禁止使用 C 语言;
从某种意义上说,AI 并没有改变软件的任何东西,只是定义软件的一种更抽象的方式;
用于构建这些应用程序的技术并不是唯一可以被监管的东西,控制投放市场的应用程序的质量非常重要;
从某种意义上说,大模型可以被看作是一种更抽象的编程语言,将改变我们未来 10 年的工作方式;
Mistral AI 在开源上并没有改变,但也一直希望在开源领域拥有领先的模型,同时也有一些只有通过货币化服务才能获得的高级功能。
-学术头条
今日推荐
开源项目
rapiz1/rathole
https://github.com/rapiz1/rathole
安全、稳定、高性能的内网穿透工具,用 Rust 语言编写。rathole,类似于 frp 和 ngrok,可以让 NAT 后的设备上的服务通过具有公网 IP 的服务器暴露在公网上。
开源之声
用户观点
这款开源 PHP 应用服务器看着有点新潮了:采用 Go 编写、支持 Early Hints
人人影视创始人致歉:重获自由一个月、机房硬盘等设备将出售
- 观点 1:嗯,我用了快 1 年多了,提交了几次贡献。
- 观点 2:php 的全部完全用 go 写,好意思用吗
- 观点 3:能比 workerman 快吗?
- 观点 4:那为啥不直接用 Go,语法还更简单
- 观点 5:PHP 积累了很多项目。比如 cms 内容管理系统。在 go 下没有特别出名的
- 观点 6:Caddy 妙啊
- 观点 1:没版权,还搞会员制提供服务,离谱
- 观点 2:会员制是不行,广告估计还不至于给抓
- 观点 3:800 多万注册用户,牛啊!
- 观点 4:很早就知道有个叫 “人人影视” 的平台,但是没想到他们会以这种方式收场
- 观点 5:作为程序员来考虑:也就是领导安排一个非法的技术需求,我完成了;我也跟着犯法了?是这个意思吗?谁给普一下法
- 观点 6:字幕组是字幕组 和后期做 app 并盈利的人人影视是两回事 贩卖盗版获利被起诉定罪不是必然的么 谁也用不着可怜他
- 观点 7:赚点流量,带货咯,先糊口。
程序员梗图
活动推荐
END
References
https://www.oschina.net/news/305853/apple-intelligence-prompt-macos-15-1-sequoia-beta
https://www.oschina.net/news/305832/tiobe-index-202408
https://www.oschina.net/news/305750
https://www.oschina.net/news/305746/windows-11-crosses-30-market-share-for-the-first-time
https://weibo.com/1655747731/Or9VRyfAO
https://weibo.com/1706699904/Or8Eq16fQ
https://weibo.com/3894431038/Or2KPxs0f
https://weibo.com/1219795431/Or3ckhpLW
https://mp.weixin.qq.com/s/esRn2f6US8_vzl83xKJPeQ
https://mp.weixin.qq.com/s/s8g5gFEV7z_K1izpJrCMpw
https://mp.weixin.qq.com/s/kVbUMEPOAr4m687q0QmXIA
https://github.com/rapiz1/rathole
https://mp.weixin.qq.com/s?__biz=Mzg4MDE3OTA5NA==&mid=2247590328&idx=1&sn=7e5234f8d40b96a74a322ffc96096cc7&chksm=ced1ef0f6d98895d29b1a7c0ed814271ba39293670d6e64d668c332232bac1b7a1b3afbe51d8#rd
https://ishare.ifeng.com/c/s/8bqrJFEqewW
https://finance.sina.com.cn/tech/roll/2024-08-07/doc-inchuuya7154995.shtml
https://www.myzaker.com/article/66b2d5cf8e9f0939a0622e5c
https://finance.sina.com.cn/roll/2024-08-06/doc-inchthwu7829160.shtml
https://3g.k.sohu.com/t/n811801649?serialId=f4991c90339779ab2924d8327e221e48
最后,欢迎扫码下载「开源中国 APP」
阅读海量技术报告、程序员极客分享