·“现在很多企业都喜欢拿AI(人工智能)说事,但不管有多少数据,核心都是要解决问题。也有人说,有了数据可以解决所有问题,在我看来,这也意味着无法解决任何问题。技术一定是有选择,有偏好的,我们目前还没有发现一种能‘包治百病’的数据平台。有了工具当然重要,更重要的是如何使用工具,借助它们能解决哪些医药难题,这是一切的源头。”
“貌似现在AI(人工智能)制药很热,相关企业也很多,但质量其实并不高,大家都在凑人工智能的热闹,真正踏踏实实写代码,做数据的人并不多。”5月25-26日,在上海举办的2023中国AI药物研发大会上,中山大学药物分子设计研究中心主任徐峻对澎湃科技记者说道。
在徐峻看来,人才荒是一个重要原因,缺乏一批专业素质高且目光长远的人带领AI制药发展。“现在人工智能不断发展,程序员的编程语言也从最初的C语言(C语言是一种编译型语言,其语法更加底层,需要开发者手动管理内存等细节)变成了Python(一种解释型语言,其语法更加简洁明了,可读性强,适合快速开发)。现在用C语言编程的程序员已经比较少见了。技术发展的同时在一定程度上也强化了人的惰性,对此我们需要小心。”
当下,很多企业都加入这场“AI热”,徐峻认为,在这场竞争中很关键的一点是数据。“我们说大数据,数据是基础也是关键,不仅公共数据,我们有多少自有数据,这是衡量一个企业AI制药潜力的重要因素。鉴于当前的国际局势,我建议尽快下载还开放着的全球公共数据。”
徐峻认为,现在很多企业都是技术和数据导向,但真正有所作为的企业一定是问题导向。他说道:“现在很多企业都喜欢拿AI说事,但不管有多少数据,核心都是要解决问题。也有人说,有了数据可以解决所有问题,在我看来,这也意味着无法解决任何问题。技术一定是有选择,有偏好的,我们目前还没有发现一种能‘包治百病’的数据平台。有了工具当然重要,更重要的是如何使用工具,借助它们,能解决哪些医药难题,这是一切的源头。”
AI也不是万能的。徐峻认为,目前来看,小分子药物(具有单一明确有效成分、分子量在1000道尔顿以下的有机化合物分子可视为小分子药物)研发量一直在下降。这种下降可能有多种原因,其中一个是靶标的问题,很难寻找到非常好的靶点,其次是小分子药物本身具有化学多样性,对于一些复杂的分子结构,可能需要耗费大量时间和金钱才能找到有效的药物候选者。另外,由于小分子药物具有广泛的靶点和作用机制,在研发过程中需要进行大量的实验和临床试验,以确保药物的有效性和安全性。如果不能解决这些问题,很难通过算法技术找到有效的解决方案。
“在药物化学领域,我们有一种称之为‘新骨架活性化’的理念,即目前有不少研究尝试从已知活性的药物化合物结构入手,寻找当中的骨架(能够赋予药物特定生物活性的分子结构框架),才能取得成功。如果我们无法发现新的骨架结构,就无法解决活性问题和ADMET(吸收、分布、代谢、排泄、毒性)等问题。换句话说,即使有再好的工具,如果没有合适的数据和实践经验,也难以取得突破。”徐峻表示。
不过,徐峻依然对人工智能充满信心,他相信AI能够帮助实现更多创新。因为小分子药物的创新还与数学里的泛函(将函数映射到实数或复数的函数)有关,泛函可以被视为超级函数,其中每层函数都与下一层函数有因果关系,随着时间的推移,AI技术将会揭示出这些多层因果关系,“我们需要耐心等待并相信未来会有更多的突破。”
深圳晶泰科技有限公司联合创始人兼CEO马健也在会议现场表示,不仅是人工智能帮助药物研发,在人才结构方面,人力增长模式下的人口红利已经过去了,未来,可能更多的是协助机器人、实验室辅助机器人等进行工作。
现场不少专家都不约而同地提到了“数据”。马健认为,在生物医药领域,未来几年人们都在谈论AI,数据是一个非常重要的话题,虽然我们已经知道了数据的重要性,但是目前大多数数据都只是在讨论其未来可能性,并没有真正地实现。此外,在生物学研究中存在很多复杂现象和不确定性,机器人可以在实验室中不断积累可靠的数据,以提供更多标准化的实验能力,比如搭建自动化实验室,“这个过程会很长,但是如果没有人去做,就永远无法达成目标。”马健说道。
复星医药战略产品发展中心副总经理李梅和徐峻不约而同地认为,国内还有很多专门从事CRO(一种专门为制药、生物技术和医疗器械等企业提供药物研发和临床试验服务的机构)工作的企业,“他们似乎还没有意识到应该采用人工智能技术,我呼吁他们抓住这个重大机遇。ChatGPT模型可以从文献中提取临床数据,借助人工智能,有助于管理临床前和临床阶段的经济效益,并帮助发现药物。我建议CRO公司赶快采用这种技术,现在还有机会。”徐峻说道。除此以外,有些CRO企业已经专注于临床数据处理多年,并已投入庞大资金,缺乏对人工智能和大数据技术的深入理解,导致浪费时间和处理无用数据,是这类企业的通病。