这个文题,或许与著名数学家张益唐教授那篇震惊世界的论文《素数间的有界距离》仿佛,不同的是:张教授几乎证明了猜想,而这一文题只是设置了猜想;张教授的论文使大多数数学家读后一头雾水,其阅读的门槛很高,我的文稿是人文科普,笔端迎合读者知识结构,简单者看似简单,复杂者读出复杂;张教授的论文是张教授用几十年心智写就,我的这篇有可能科学上网时让ChatGPT秒出;张教授证明了数百年难题,我的问题难在未来一年、十年……文题虽玄乎,其实我想说的是:药什么时候与ChatGPT勾搭上,打开药的别有一番天地,人类重要的抗感染药很多年都没有突破了,我们太需要这一创新机会!
ChatGPT,这个词儿我是从一位同学那儿知道的。大约2022年12月初,在牛津大学攻读人工智能(AI)方向博士学位的同学孩子,参加在美国举办的AI顶会,他是去会上宣读代表牛津学派的学术论文,同时见识到硅谷Open AI公司推出的ChatGPT。此时,据说ChatGPT已经拥有100万用户,而且不久就上亿了。对于编代码、修bug、写小说、做作业、创作菜谱、翻译文献、评价文稿等文字输出型任务的完成,已经非常溜了。与用户对话,能根据前言后语作出实时对应,只是有时会说出一两句莫名其妙的令人类无语、不能理解的话,我想这正是人类跳跃思维的短板,很可能是一种起越文本,应该考虑涉及人类感兴趣和需要破解的一种引领——经过深度学习和大型语言模型,出现了成人与儿童,老师与学生的区别,只是不知道谁是前者谁是后者。
此后,很短时间,大约2023年春节前后,在国内最先做出强烈反应的不是专业团队和专家学者,而是资本市场。中国股市风起云涌,所有涉及ChatGPT概念都被狂炒一波,而绝大多数股民特别是散户彼时尚不明白ChatGPT为何方怪兽,安得如此魔幻。有一家深圳上市公司,因为仅仅提供清洁室工程咨询、设计和施工,与ChatGPT沾点边,其2022年三季报净利润同比为-10860.04%,业绩差到如此地步,也被炒到多个涨停板,至今雄居高位,意犹未尽。真正有价值的行动是北京市门头沟区人民政府与中关村于2023年2月10日联合打造人工智能科技园项目,一期投资39亿元,规划建筑面积30.9万平方米,试图通过空间、算力、模型、数据与云等核心竞争力占据人工智能高地。显然这是预谋已久,布局多年,国家体面,诚有所待也。现代科技与钱相关,更是烧钱项目,但钱与人类大脑相比并不重要,没有人看到有钱能使鬼推磨。极具智慧的大脑在人类为数不多,通常我们并不知道何时出现和以什么方式出现,正是这些天才的出现改变了高端科技的进程和方向,也改变了人类社会。
一个非常灵异的现象:那些世界著名高校的“辍学生”,可能世俗理解为成绩不好念不下去或不想念下去或其他什么的,他们正是这些天才大脑的集聚高地。比较熟悉的如微软比尔·盖茨、苹果史蒂夫·乔布斯、脸书马克·扎克伯格,现在轮到萨姆·阿尔特曼,这位斯坦福大学的“辍学生”,现在ChatGPT的老板。一般认为:百年来,人类已经历三次超级工具降临,主要发生在近50年。第一个是互联网,它引发了“空间革命”用虚拟的聚合,跨越了时空,使广袤的世界触手可及,让政治、社会、商业、军事等等发生连续变化,可以说现在没有人能离开互联网。第二个超级工具是智能手机,当乔布斯举起第一部iPhone手机时,谁能相信时任微软总裁称:“世界终究要按照我们的规则”,竟是一句真话。如今置身其中的我们已无力自拔,社交、消费、宣泄……都出现在这一方狭小的屏幕上,最快的交易、最速的送达、最短的等待都已被算法标记。据统计,1999年,中国网民人均每周上网17小时,2022年,这一时间已达29.5小时。除了睡梦,尽在网中,而且会经常梦在网上。同时这一统计本身也许只有互联网才能做到,你能不能说清楚这到底是一张什么网?现在,第三个超级工具ChatGPT降临了,据说它将引发“思维革命”,会改变人类思考和处理问题的方式,并由此重塑世界。这一次,人类面临重大抉择。
当下,无论学者和百姓,多习惯于碎片化知识,因为轻松。大概也没有多少人包括我在内有时间或有兴趣去读史诗级的长篇科幻或魔幻文学作品。海外公认有三部:赫伯特的《沙丘》、阿西莫夫的《基地》、托尔金的《魔戒》。从情感上说,我想我国刘慈欣的《三体》也是,他早在2018年继雨果奖之后在美国又获得了科幻作品的最高奖——克拉克奖。这四部史诗级科幻小说我都没读完,有的不理解,有的无厘头,有的没兴趣,有的太魔幻。直到去年在线看了丹尼斯·维纶纽瓦导演的电影《沙丘》后,才知道在10191年(尚有8168年)之前,曾发生一场战争,战争中人类的对手是人类自己创造的会思考、善决断的机器人(Thinking machine)。血腥的战争,人类拼尽全力终于击败这些机器人。之后,人类决定永远禁止这些机器人的存在。我想这些机器人祖先的魂灵应该就是现在的ChatGPT。
留学美国加州大学圣地亚哥分校神经生物学孙睿晨博士,去年在《赛先生》上发文,论述ChatGPT的前世今生以及未来。我很高兴他现在加入我们药师队伍,成为美国药企的数据科学家。他说Chat GPT的前世可以追溯至2017年,谷歌大脑团队(Google Brain)在神经信息处理系统大会(NeurlPS)发表了一篇名为“Attention is all you need”(自我注意力是你所需要的全部)的论文。作者在文中首次提出基于自我注意力机制(Self attention)的变换器(Transformer)模型,并首次将其用于理解人类的语言,即自然语言处理。此前,自然语言处理领域的主流模型是循环神经网络(RNN,recurrent neural network)。2017年提出的Transformer 模型,能够同时并行进行数据计算和模型训练,训练时长更短,并且训练得出的模型可用语法解释,也就是说模型具有可解释性。经过训练后,这个最初的Transformer模型就成为最先进的大型语言模型(Large Language Model,LLM),当下现身的ChatGPT是其代表作。语言模型改变了自然模型处理(NLP)的格局,拓展了训练蛋白质结构和分子结构的空间,这对制药至关重要。在众多研究Transformer模型团队中,Open AI公司于2015年12月在美国旧金山成立,并一直专注寻找学科前沿和极限使其当下炙手可热。特斯拉的马斯克是公司创始人之一,虽然离开了公司但至今仍是金主。据说喂食和训练这个东西很烧钱,训练一个GPT-3模型保守估计需要500万美元至2000万美元,训练GPU越多,成本越高,时间越短。形成网红爆款的ChatGPT是GPT-3.5。但是3月17日,微软把AI神器GPT-4全部接入office,使Chat PPT、Chat Word、Chat Excel全新登场。CEO纳德拉在发布会上宣布:“今天,进入人机交互的新时代、重新发明生产力。”显然,很短时间,一个接一个出现的都是王炸。一位科学家说了一句话:和ChatGPT-4聊完后,我觉得一切可能来不及了。是的,以这样的速度GPT-5、GPT-6、.GPT-7……大概率正在路上,人类不可能如小说《沙丘》所言,要在8168年这样一个漫长的时空与自己制造的智能机器人手刃。突发并意外是这个时代的特征。
能真实感受一下ChatGPT的神奇能力,还是我的同学给我看的以中国武侠小说和人名为关键词写的一段小小说:
在苏州城的一处静雅宅院里,清清和她的侍女正在练习剑法。
清清是江南名门之女,自幼便喜爱武学,又因为出色的才华和绝佳的容颜,备受人们的爱戴和敬仰。
忽然,一位神秘的剑客闯入了院子,高声喊道:“清清,我是来向你挑战的!” 清清不惧挑战,拔出手中的长剑,与剑客展开激烈的战斗。两人你来我往,剑气纵横,演绎出一场精彩绝伦的武打表演。
当清清以精妙的剑法胜出时,剑客却突然跪地求饶,承认自己的目的并非为了挑战,而是为了向清清表达他的爱慕之情。
原来,剑客名叫清风,是一位红颜知己,也是清清的青梅竹马。他在长期的修行中,一直默默地关注着清清的成长,并暗暗为她守护着。
清风倾诉着自己的爱慕之情,清清感到十分感动,两人终于相认相爱。
然而,这段纯真的爱情却面临着重重阻碍。清清的家族不允许她嫁给一个武林人士,而清风的身份也因此成为了无法跨越的鸿沟。
在江湖的风云变幻中,清清和清风一次次相遇又分离,但他们的心却始终相连。
最终,清清决定放下身份和家族的束缚,选择了自己的爱情,和清风结为连理。两人共赴浪漫的江南,过上了幸福美满的生活。
这段中文在一秒钟内瞬间实现,我感到非常美妙!当你希望来点穿越和科幻,接下来就会出现上天入地、宏法无边、情意缠绵的故事……现在不是沉溺美文的时候,我们已经跑题太远。
前面写的这些零零碎碎的知识好似AI神经网络训练,反反复复、不断周纳、无穷迭代在我准备此稿文案过程中相互交织挥之不去。而这篇论稿,我们要谈的主要是ChatGPT对药的影响。全球医药行业的产业升级正围绕数字化、智能化、自动化等方向拉开序幕,2022年已有24家AI制药公司67条管线,现在ChatGPT横空出世,接下来会有好看的。AI辅助药物研发作为其中关键技术之一近年来已有多项重大科研成果转化落地。AlphaFold可预测出地球上几乎所有蛋白质结构,深度学习工具ProteinMPNN可一秒设计全新结构蛋白质,AI技术平台精准地从头设计出能够穿过细胞膜的大环多肽分子……然而步入临床阶段,AI制药获得临床验证的药物较少,至今仍没有上市获批药物。对此,AI制药领域资深专家Daphne Koller教授在去年药明康德健康产业论坛上表示:“AI可以为制药做出重要贡献,实现机器与人类之间的良性协作,帮助设计实验,生成数据,分析输出结果,但可能还不是现在,要等上数十年的时间。”去年已经过去,今年AI推进的速度太快了,这是Daphne Koller教授没有想到的。GPT-4已经具有强大的图像识别功能,并且超出人类想象。这一药物研发的短板正在衍变为强项。药物与ChatGPT有界距离,可能像张益唐教授那篇论文“素数间的有界距离”所暗示的,由张教授的下极限为7000万,经数学家陶哲轩的一个Polymath8项目改进了下极限——当然在张益唐教授方法的框架内,不断由6000万、4200万、1300万、40万,推进到246。张益唐教授实现的是0-1,有了方法、思路其他各位教授就有可能实现1-2……1-99。我们非常期待在ChatGPT催生下,第一个AI新药的出现,实现0-1的突破。但这太难了,药的空间位置和结构,是人类想象的产物。如果ChatGPT们真的没有想象力,恐怕永远也做不成药。对于这一点也许现在ChatGPT还蒙在鼓里。
本文结尾,我想告诉大家:对于Open AI公司而言,创始人马斯克提前离场,老板阿尔特曼不持一股,这些围绕金钱和信仰的争议,如果不能动摇人类的意志和想象,就不会影响AI的前行,而且现在就没有,最终ChatGPT们也不可能战胜人类。
我还想告诉大家,莫言先生说:在某种意义上,把自己不明白的事理直气壮地写出来,就是诗。把自己明白的事遮遮掩掩地写出来,也是诗。作为药师,我理解的ChatGPT的所有行为都充满诗意,并构成向AI自身和人类致敬!
全球主要AI制药(药明康德绘制)
于上海复旦中山医院病隙
2023.3.26
作者简介
夏也 一介药师 孤芳哲学理学药学边缘研究 自赏文法章法书法内心荒凉 期许学界:药学唇齿,人文襟抱
来源:《中国药房》网络版2023年第1期