当前位置:首页|资讯|AIGC

AI for Science将带来新“科学革命”,姬十三在“AIGC创建者大会”发表演讲

作者:未来光锥发布时间:2023-05-08

5月7日,果壳CEO、未来光锥前沿科技基金创始合伙人姬十三受邀参加首届“数字设计:AIGC创建者大会”,本次大会由特赞科技Tezign主办。会上,姬十三发表题为“迈向新科学革命——迎接第五范式”的主题演讲。

以下为姬十三演讲实录,略有编辑:

近现代史里几次工业革命极大提高了人类的生产力,也重塑了世界的样貌与规则。而在工业革命的“奇点”之前,还有漫长的科学革命、技术革命的序章。可以说,几十年前的科学革命,是几十年后工业革命的伟大基础。

科学研究是真正的长期主义,如果我们今天能推动新一轮科学革命的诞生,也许就能在十几年、几十年后,在下一次工业革命中取得优势。而我们恰好有一个加速科学研发的时代机遇:科研范式的切换。

图灵奖得主、前微软研究员Jim Gray曾描述了四种科研范式的观点

人类用了几千年理解世界运行规律。在一开始,科学研究是靠经验主义,于是有了不那么准确的月亮历法、有了传统医学,这是研究的第一个范式,持续数千年时间。而在几百年前,一群天才的数学家、物理学家与化学家,开始建立自然的理论模型,我们今天熟知的一系列公式、定理,从牛顿力学到薛定谔方程,都可以归结于科学家对自然建立的理论模型,这是第二个范式。

第二个科研范式的成果,解释了很多的科学问题。但从基本物理定律出发也会有实践的难题,很多人可能听过一个“真空中的球形鸡”的笑话,它其实也反映出物理学家长期以来的无奈——方程就在那里,可很多连数值解都很难给出,所以需要进行大幅简化模型,忽略次要因素的影响。

第三个范式,计算科学,正是为“算不出”而生。现代计算机诞生以后,科学家便将它们用来计算、模拟、仿真现实的体系。它是一门发展了几十年的科学,直到今天,还有很多经典的科学计算软件,是用当年极其古老的编程语言编写的。

计算真实世界极端复杂,即使在几十年后的今天,也仍然远远超出了超级计算机的算力极限,科学家们用着日新月异的超算,也仍然需要简化模型。

第四个范式,则是最近20年来的时髦概念。它强调一种“数据的科学”。第三范式是先提出可能的理论,拿理论计算的结果,去对照实际实验体系,验证理论的正确性;而第四范式则是先收集海量数据出发,再从数据中找到规律、提炼理论。举个简单的例子,通过对特定数据库的分析,材料科学家们可以获得一个预测钢材疲劳的模型;而在超导材料配方领域,前一阵子在各大科技媒体刷屏的所谓“常温超导体”,也都是有数据库建立模型推算出来的较优解。

但真实世界的复杂程度还是远超想象。人类面对的潜在的稳定材料体系,在10的180次方上,大约是宇宙所有原子数量的平方。它超出了传统计算科学、数据科学,也就是第三、第四范式的能力。

这就是第五范式的机会。

这一轮AIGC热潮很大程度上归功于GPT,GPT背后是OpenAI,而OpenAI背后又站着微软。曾经提出过四个范式的是微软,去年,微软又喊出了第五范式的口号——人工智能的科研范式,真正以智能驱动和知识为中心的新的研究范式。

它是如何工作的?

某种程度上说,它是前几个范式的结合,取长补短。它先由数学物理模型、计算机的数值解出发,让计算机先算出一些数据的散点,然后将这些结果,作为训练的素材送给人工智能,建立起针对这个科学问题的预训练模型,通过计算与实验数据微调、完善,最后在模型里计算最终的科学目标,比如一个结构、一个蛋白等等。

当然,通过AI模型去算,比穷举所有可能性全从头算一遍,是更实际的选择。

在我们与很多自然科学家、计算机科学家的交流中,这种“预训练”的思维贯穿这一轮AIGC热潮。AI之于科研,除了全新的科研范式之外,还有更多有趣的工作。

比如写代码。今天很多科学家需要用新的科研范式——从第三到第五范式,都免不了跟程序打交道。AIGC就可以帮科学家。

有材料学家发了一篇测试ChatGPT性能的文章,他们拿ChatGPT写Matlab指令,写专用于科学计算软件的代码,都得到了初步可用的结果。特别有意思的是,他们在2月20日测试的结果还不太准确,但到了3月10日,同样的问题,ChatGPT就给出了明显更优的代码。科学家认为ChatGPT的认知在显著进步,即使它以后也可能无法给出最优的答案,也至少可以提供准确的代码思路,在AIGC时代,计算化学即将发生翻天覆地的变化。

他们用的还只是最通用的ChatGPT,但很多科学家已经开始建立更优化的专用模型。比如怎样让大模型理解专业词汇的SciBERT,这篇论文被引用了近2000次;上个月,有另外一群科学家建立了集成更多化学工具的模型,目标也是让科学家能更自然地完成研究工作。

当然,科学家们还在用AIGC做更多工作。一些很容易想到的,用ChatGPT帮忙翻译论文、提取论文核心信息,或者给自己的论文润色;我们最近也跟一些AI for Science的创业者交流,有的人用GPT和知识图谱,建设了一个快速搜索有药效的分子的系统;在科学教育层面,AIGC也有应用的潜力。

我们认为,今天的人工智能已经成为科研领域不容忽视的强大工具。积极拥抱AI的科学家,将有希望在新一轮科学革命中占据先机。我们今天看到很多生物、化学、材料科学家,开始建设自动化的、高通量的合成平台,以快速获取数据、训练模型。产业界也在顺应这个趋势,有一些科研机器人公司,也做起了为科研淘金“卖水”的生意。

显然,这种基于人工智能的科研范式,需要更多科学家跨学科的交叉合作。数据从哪儿来?模型怎么建?怎么用?这些问题都是新的时期,科学家们已经关心的话题。每一次科研范式的转变,都可能需要一群不同的人,在不同角度形成合力推动。我们也组织了一个社群,尝试用更多更跨界的讨论,让AI更好地服务于科学研究。

科研范式的切换是漫长的,Jim提出第四范式的时候,他为此去推动建立更开放的电子图书馆、数据库,变成一个“所有科学文献都在线、所有科学数据都在线并且相互交互的世界”。直到今天,这仍然是一个过于浪漫的想象。但在AI驱动科研的第五范式刚刚冒尖的时候,我们很期待看到更多中国的团队,能用上最先进的装备和理念,在这一轮科学革命、技术革命的飙升中取得伟大的成功。

会后合影

关于“数字设计:AIGC 创建者大会”:

首届“数字设计:AIGC 创建者大会”是在上海市经济和信息化委员会的指导下,由特赞科技 Tezign主办,联动了50+在AIGC内容科技领域有前沿实践和独特洞见的内容共建者,邀请各跨界分享嘉宾,为AIGC的建设者和创作者搭建了“双向互动最大化”的舞台。据了解,本次大会的主会场选址于一个世纪前的未来实验室,既是近百年历史的“雷士德工学院旧址”,也是焕新后的世界级设计驱动式创新引擎——上海创新创意设计研究院。大会吸引了1500+名创建者线下参会上百万人观看线上直播。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1