当前位置:首页|资讯

重大科技成就发布会|致敬开源的力量成功举办

作者:CSDN发布时间:2024-12-23

12月18日,以“新纪天工 开物焕彩——致敬开源的力量”为主题的重大科技成就发布会开源专场在国家科技传播中心成功举办。发布会立足教育、科技、人才良性循环,聚焦中国具有标志性、战略性、引领性的重大科技成就,依托国家级科学文化公共服务平台——国家科技传播中心,首发科技成就中的技术进步、工程进展、产业进阶,推介战略科学家、一流科技领军人才和创新团队、卓越工程师等,传播科学家精神、科学精神和科技成果,汇聚造就高水平科技自立自强的磅礴力量,服务科技强国建设。

开源创新,四项科技成就发布

开源作为科技创新重要的协作模式,已成为推动全球信息技术发展的强大动力,并从最初的软件行业走向了硬件、芯片等多个领域。

发布会上,中国算力网开源开放试验场、星辰语义大模型平台、书生大模型、“香山”开源高性能RISC-V处理器核四项成就进行了最新发布。

一、中国算力网开源开放试验场2025年将提供超100万卡时普惠算力

中国算力网开源开放试验场在系统软件层面,研发了广泛兼容多种异构国产智能芯片的系统软件栈,实现了国产集群的云化纳管与云际化任务调度,可支持华为、寒武纪、海光等10余种国产算力芯片;在应用服务和开源生态方面,研发了涵盖模型训练、微调与部署等全流程工具链,基于全国多地算力构建的试验场为大规模开源开发者提供普惠算力,支撑了全国人工智能大赛等开源创新活动,汇聚了一批优质的面向国产算力的开源项目、开源数据与开源模型。

中国工程院院士、鹏城实验室主任高文院士在为项目作推介时表示,当下AI 正引领我们进入全新的算力时代,为构建充满活力的算力生态,我们需拥抱开源开放。中国算力网开源开放试验场不仅是技术的实验地,更是创新的孵化器,旨在开创协同、共享、普惠的生态发展模式。

中国工程院院士、鹏城实验室主任高文院士

鹏城实验室高效能云计算所所长余跃

余跃在发布中回顾从主机时代到人工智能时代的开源历程,指出开源已成为推动技术创新和普及的关键力量。算力作为新质生产力的代表,正逐渐成为衡量国力和生产力的重要标准。在此背景下,鹏城实验室、新一代人工智能产业技术创新战略联盟联合发布了中国算力网开源开放试验场。试验场可调度总算力超过5E Flops,结合社区日常活动、AI赛事等多样化开源举措面向全社会提供大规模普惠算力资源,惠及国内外AI开源开发者17万人,通过对国产算力的大规模开放式应用推动了国内自主算力厂商的芯片完善与生态建设。展望 2025 年,试验场计划提供超过100万卡时的普惠算力,推出易用套件简化各类计算卡接入算力网的过程,加载超过500T的公共数据集用于预训练和微调,举办更多活动以促进国内产、学、研、用的开发者生态繁荣。

二、星辰语义大模型完成全国产化万卡万参大模型训练,实现国内首个万亿参数大模型完整训练

星辰语义大模型平台是由中国电信人工智能研究院基于与北京智源人工智能研究院联合研发的Tele-FLM系列模型中的TeleChat-52B打造的通用生成式语义大模型对话平台。该平台支持知识问答、日常对话、文本生成、逻辑推理、数学计算、代码辅助、党建公文写作等通用能力。同时支持基于RAG技术的知识库、文章的挂载问答,支持互联网检索的功能。

中国电信集团CTO、首席科学家李学龙在为项目做推介时表示,星辰语义大模型已完成从1B模型到万亿参数模型全尺寸开源,目前下载量达40多万次,有效推动智能政务、智能助理等多领域的智能化升级。未来将继续拓展技术创新与行业应用,共同携手构建繁荣的人工智能生态。

中国电信集团CTO、首席科学家李学龙

北京智源人工智能研究院研究员姜鑫、中国电信人工智能研究院语义算法研究中心高级算法总监宋双永一同发布了Tele-FLM-1T模型与星辰语义大模型成就。姜鑫首先介绍联合研发成果Tele-FLM-1T:大模型规模定律表明模型能力随参数规模的提升而提升,为探索更低成本训练更大模型的方法,智源研究院与中国电信共同研发了全球最大的单体稠密大模型Tele-FLM-1T。Tele-FLM-1T的训练采用生长技术,仅使用了业界常规技术9.1%的算力。AlignBench评测显示52B参数模型中文能力达到GPT-4九成以上。双方对模型参数及训练过程的技术细节、训练曲线均进行了开源,希望可以帮助和启发业界对超大规模模型训练的探索。

北京智源人工智能研究院研究员姜鑫

随后宋双永介绍星辰语义大模型的最新进展:星辰语义大模型完成全国产化万卡集群上的万亿参数语义大模型训练,该训练过程以小参数模型为指导,提升大参数模型训练稳定性,保障整体训练效果,最终实现了精度误差低于千分之五,GPU 同等算力计算效率超 93% ,模型有效训练时长占比超 98%。新版星辰语义大模型TeleChat2系列在今年的各类权威榜单、科研竞赛和学术论文等方面均取得了不俗成绩。2025 年,星辰语义大模型还将继续大力投入开源工作,在原有参数开源模型的基础上增加32K、128K、1M等长文推理版本,以及在推理资源 & 推理效果上有更优平衡的MoE版本。

中国电信人工智能研究院语义算法研究中心高级算法总监宋双永

三、多模态大模型书生万象InternVL2.0,在关键评测指标比肩国际顶尖商用闭源模型

书生大模型由上海人工智能实验室发布,其中书生·浦语 2.5 具备一百万词元(Tokens)的超长文本窗口及开源模型中领先的推理能力,并支持自主规划和在线信息整合,成为助力复杂问题高效解决的得力AI助手。多模态大模型书生万象InternVL2.5,在关键评测指标比肩国际顶尖商用闭源模型,支持图像、视频、文本、语音、三维、医疗多种模态,百种下游任务性能媲美任务专用模型。

上海人工智能实验室主任、首席科学家周伯文在为项目做推介时表示,书生大模型体系涵盖书生·浦语大语言模型、书生·万象多模态模型、强推理模型InternThinker(书生思想者)。秉持高质量开源理念,自2023年7月以来,上海人工智能实验室对书生系列大模型提供免费商业授权,并开源全链条工具体系,积极为国内开源创新生态贡献力量。未来书生系列大模型将持续迭代模型并开源,实验室将保持开放,携手产学研,成为技术发展的连接器、放大器和加速器,共同构建广阔的人工智能开源生态。

上海人工智能实验室主任、首席科学家周伯文

上海人工智能实验室青年科学家陈恺发布中表示书生大模型体系涵盖语言、多模态和强推理等不同类型模型,并配套全链条工具体系,包括数据处理、预训练、微调、推理部署框架以及评估系统。书生大模型致力与国内外优秀的开源项目兼容融合,支持多种训练、推理框架及应用工具。书生大模型不仅服务于学术研究,也应用于产业界,如智能体开发、数字化平台建设等,助力国计民生。此外,上海人工智能实验室还通过实战营和挑战赛等形式培养人才,推动大模型技术的发展。

上海人工智能实验室青年科学家陈恺

四、“香山”已成为国际开源社区中最活跃、性能最强的RISC-V处理器之一

“香山”开源高性能RISC-V处理器核由北京开源芯片研究院发布。“香山”开源高性能RISC-V处理器核源于由中国科学院在2019年布局的“中国科学院先导战略专项”。作为该项目的承担单位,中国科学院计算技术研究所于2021年成功研制了第一代开源高性能RISC-V处理器核“香山(雁栖湖)”。第一代“香山”主频达到1.3GHz@28nm,SPECINT2006评分超过7分/GHz,同频性能达到ARM A72水平,是同期全球性能最高的开源处理器核。

中国工程院院士、“科创中国”开源创新联合体荣誉理事长倪光南在为项目做推介时表示,“香山”开源高性能RISC-V处理器核的源代码通过以GitHub、GitLink等国内外开源托管平台,获得约5000个Stars、670个fork,成为国际开源社区性能最强、最活跃的RISC-V处理器核。目前,“香山”开源高性能RISC-V处理器核已完成三次流片,为芯片产业创新发展做出卓越的贡献。

中国工程院院士、“科创中国”开源创新联合体荣誉理事长倪光南

发布会现场,香山开源社区主席唐浩晋正式发布了“香山”开源高性能RISC-V处理器核成就。唐浩晋表示,在当今芯片设计变革的时代,RISC-V作为灵活开源的架构,正引领着开放性芯片设计的趋势,“香山”开源高性能RISC-V处理器核(下文简称“香山”)的出现恰逢其时。“香山”致力于解决开源处理芯片生态面临的性能与可配置性的挑战,不仅开源硬件设计代码、文档以及一系列开发工具和平台。“香山”已历经三代发展,最新版昆明湖V2进一步提升性能与功能,包括对虚拟化(H扩展)和向量运算(V扩展)的支持,这些对于云计算和AI推理至关重要。通过北京开源芯片研究院联合企业和高校,加速科研成果的产品化和商业化,形成了开源芯片协同瀑布模型,确保“香山”可以达到企业使用级别的标准。基于这种开源模式和敏捷方法的联合开发机制,“香山”已成为国际开源社区中最活跃、性能最强的RISC-V处理器之一,为先进计算生态提供重要的技术支撑。

香山开源社区主席唐浩晋

大咖荟萃,共议开源与人工智能

在圆桌对话环节,中国计算机学会开源发展委员会副主任、LVS创始人章文嵩,中国电子技术标准化研究院软件应用与服务研究中心云计算研究室主任杨丽蕴,鹏城实验室高效能云计算所所长余跃,开源资深专家、中国开发者社区(CSDN)CTO 谢志锋等嘉宾共聚一堂,由开源社理事长,蚂蚁集团开源增长 & 国际化负责人江波主持,以“共议开源与人工智能”为主题,进行精彩的观点碰撞。

从左到右:江波、章文嵩、杨丽蕴、余跃、谢志锋

我们在探讨人工智能大模型的未来时,开源与闭源之争成为热议话题。对此,章文嵩基于多年从事开源工作的经验,坚信开源大模型将最终超越闭源大模型,认为长远来看这是必然趋势。他指出,大模型训练本质上是数据工程管理,而数据获取正变得日益困难。闭源大模型公司将会遇到数据来源问题,因为数据作为每个企业的重要资产,可能很多企业不愿意为闭源大公司贡献数据。相比之下,开源模型由于非营利性质,更容易获得社区和企业的数据支持。

余跃认为,开源大模型代表了一种必然的趋势。在人工智能时代,开源的意义超越了代码本身,还涉及上下游软件、数据集、社区组织方式、应用场景以及模型加速方法等一系列要素。当前,许多大模型算法已开源,代码天然地倾向于开源,而暂时保持闭源的是通过大量算力加工出的模型参数,如OpenAI的GPT系列。随着新的商业服务模式的探索和发展,当它们不再是维持竞争优势的核心关键时,这些原本闭源的组件可能逐渐转变为开源的一部分。

进入 Gen AI 时代,开源发生诸多变化。正如杨丽蕴指出,过去根据开放源代码促进会(OSI)定义的开放源代码定义 ( OSD ),符合其10条原则的许可证才被视为真正的开源许可证。在AI大模型开源的趋势下,OSI对数据的要求并不强制公开,这引发一些争议。有人认为相比过去严格的10条要求,现在对于开源模型的规定似乎有所放宽,尤其是在企业贡献自身数据方面存在困难和挑战的情况下。由于开源模型领域尚处于起步阶段,业界尚未形成统一标准,因此厘清AI开源模型的边界及确定哪些内容应当公开,仍需产业界共同探讨。

面对大模型和开源人工智能的快速发展,开发者有哪些新机遇?谢志锋表示,尽管开发者渴望捉住当前大模型发展机遇实现创新,但面临不同于传统软件开发的挑战。此时,国内社区和平台的作用变得尤为关键,如何利用好平台和服务是开发者抓住机会的关键。随着更多相关平台在国内涌现,开发者将拥有更多机会参与到大模型和AI应用的创新中,推动技术进步的同时也为个人职业发展开辟新路径。

诠释开源精髓,2024开源创新榜榜单揭晓

中国开源事业的蓬勃发展,离不开各位开源人对技术的创新、开源路径的探索以及开源生态的建设。

2024年开源创新榜单由中国科协科学技术传播中心、中国计算机学会、中国通信学会、中国科学院软件研究所共同主办,中国开发者社区承办,面向中国开源行业领域,遴选具有创新性、贡献度和影响力的开源项目、社区、应用场景与开源事件,王怀民院士为首组建评审委员会,经研讨评审,评审出10个年度开源项目、10个年度开源社区、10个年度开源应用场景与10大年度开源事件。

发布现场,中国通信学会副理事长兼秘书长张延川、中国科学院软件研究所副所长钟华、中国计算机学会副秘书长王新霞、中国科协科学技术传播中心副主任孟令耘为上榜单位颁发纪念证书。

新纪天工、开物焕彩,致敬开源的力量,未来让我们携手并进,以开放开源的理念,共同推动中国开源事业的发展。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1