AI新洞察 | 潘毅：AIGC大模型赋能生物医药

作者：深圳人工智能行业协会发布时间：2024-12-19

在2024全球湾区科技创新发展论坛上，深圳理工大学计算机科学与控制工程院创院院长、讲席教授、中国科学院深圳先进技术研究院首席科学家、深圳市重点实验室主任、美国医学与生物工程院院士潘毅发表了主题演讲——《AIGC大模型赋能生物医药》，结合生物医学应用，在大模型“热”的时代下给出“冷静”的思考，以及在人工智能赋能医疗行业的探索、突破和创新，代表了未来机器学习的新方向与人工智能技术的新成果。

当下，尽管多个国家都在布局大模型，中国也有如百度、华为等企业在这一领域有所建树，但未来的发展重点不应仅仅是开发更多的大模型，而应是如何更好地利用这些模型。

潘毅院士提到，华为的大模型是通过功能划分的，涵盖了视觉、自然语言等多个方面。他进一步阐述了行业大模型的概念，如煤炭、医疗等行业模型，以及更高层次的场景应用，例如在医疗领域，大模型可以用于治疗疾病、诊断指标和制药等。

从单一到组合，人工智能大模型加速演变

在2023年3月的一次访谈中，我曾指出大型模型的不可持续性，原因在于其高能耗和高昂的成本。当时我认为，对于特定领域，如专业模型、药物模型或诗歌创作模型，已经足够。如今，我们迎来了生物模型的突破，其中行业模型已经实现。同时，我提出了一个新的概念，即单一模型不足以应对所有问题，例如顺丰模型在处理法律问题时可能无法给出答案。我提出可以将三个小模型组合成一个大模型，类似于“三个臭皮匠，合成一个诸葛亮”。这种组合模型的优势在于成本效益高，因为它不需要训练数据。例如，当需要撰写一篇文章而小模型无法解决法律或医疗问题时，可以求助于ChatGPT这样的大型模型。目前无法解决的问题，可以在3秒钟内提出问题并得到答案。这种做法的好处在于节省成本。大模型可能需要数万美元一天，而文心一言、ChatGPT只需几秒钟和几块钱即可解决问题，与本地小模型结合使用将更加可靠。我的一位同学曾是微软中国区的负责人，他的大型模型的能耗仅为ChatGPT的四分之一。因此，未来模型之间的比较不仅在于质量，还在于能耗。能耗低意味着技术更先进。

“六驾马车”助力人工智能可持续发展

在当前的人工智能领域，我们通常讨论三大核心要素：数据、算力和算法。然而，我认为应该将人工智能的发展扩展为“六驾马车”，具体包括：大数据、优算法、强算力、赋知识、可解释性和低能耗。首先，大数据是基础，为人工智能提供丰富的信息来源。其次，优化算法是核心，能够提升人工智能的处理效率和准确性。再者，强大的算力是保障，确保人工智能能够快速处理复杂任务。

此外，赋予知识是关键，即将行业知识融入人工智能系统中，使其能够更好地理解和执行特定任务。例如，在顺丰快递中，通过赋予知识，系统能够不仅识别问题，还能解释问题的原因。可解释性是人工智能发展中的重要方面，它使用户能够理解人工智能的决策过程，从而增加信任和透明度。

最后，低能耗是人工智能可持续发展的必要条件。尽管大模型在处理能力上具有优势，但如果其能耗过高，甚至消耗掉整个城市的所有电力资源，那么这种模型将变得不切实际。因此，我们必须持续倡导和研究低能耗技术，确保人工智能的发展既高效又环保。

人工智能在医疗诊断中的潜力与挑战

在医疗应用领域，美国有一个案例，一名儿童的母亲带他咨询了十几位医生，但均未能确诊，也未提出有效的治疗方案。最终，她在ChatGPT上输入了孩子的症状，如感冒、鼻塞、发烧等，ChatGPT提供了一个症状分析和治疗方案。随后，她将这一诊断结果带给了医生，医生经过检查后确认方案有效，似乎准确无误，于是按照方案给孩子服药，孩子最终痊愈。这一案例说明，ChatGPT有时可能会出现错误诊断，但有时也能提供正确的建议。

上图中的这篇文章描述了医疗管理领域遵循癌症管理建议的情况，发现其中62%的建议是正确的，但也有错误之处。未来如何应用人工智能（AI）成为一个亟待解决的问题。与此同时，中国和美国在AI开发方面都有显著进展。例如，美国的GPT技术能够检测内容的真实性，防止篡改；而中国推出的AIGC X技术则能够实现内容的溯源，指出建议中的错误。我的学生在杭州成立了一家公司，开发的软件能够预测并识别面部是否经过替换，以及文件上的印章是否被篡改。这表明AIGC技术在内容生成方面表现出色，但同时也需要相应的规范措施。

提升自闭症问答系统性能：结合RAG技术与专业知识的创新应用

AIGC技术拥有广泛的应用领域。今天，我将介绍一个与顺丰相似的例子，即自闭症问答系统。当一位母亲在医院面临众多问题时，例如自闭症与哪些因素相关，若将这些问题输入到通用的AI模型如文心一言或ChatGPT中，得到的回答往往不尽如人意。这是因为这些模型在处理自然语言和专业问答方面存在局限性。然而，当我们采用结合了RAG（Retrieval-Augmented Generation）的大模型，并赋予其专业知识时，结果显著改善。我们使用了Llama模型，并整合了200篇与自闭症相关的专业文献以及一些标准的医院报告，这些文献和报告由专家提供。通过这种方式，我们得到了非常满意的结果。顺丰使用五个维度来衡量，而我们使用六个维度，包括可靠性与回答准确性。在145个通用问题中，我们的系统能够准确回答那些连ChatGLM3和ChatGPT3.5都无法回答的问题。

AI在药物筛选与设计中的创新应用与挑战

AI在制药流程中的应用同样昂贵且耗时，但其在各个阶段都具有潜在的应用价值，例如利用病例数据库和蛋白质数据库等。以药物筛选为例，一旦确定了靶点，即找到了治疗癌症的“锁”，接下来的任务是找到与之匹配的“钥匙”，即药物。如果一个“钥匙”能够打开多个“锁”，它可能成为一种万能钥匙，但同时也可能成为一种毒药。我们通过AI进行匹配，以确定哪些小分子与特定的靶点相匹配。例如，通过人工智能筛选，8888个小分子可以减少到421个，再进一步筛选到69个，最终有4个进入试验阶段，其中一个成功，这证明了我们的筛选方法的有效性。

在药物设计方面，大语言模型可以用于生成新的小分子。例如，将徐志摩和李白的诗歌输入模型，可以生成新的诗歌。类似地，在制药领域，通过打乱小分子的结构，可以创造出新的小分子，这些小分子可能与现有的中药或西药成分不同。我们拥有一个包含5万个分子的药库，通过模型可以产生6万甚至7万个新的分子。然而，如果没有筛选机制，这将导致信息过载。例如，如果生成5000首诗让某人审阅，这将是不切实际的。因此，我们使用AI进行筛选，以找到与特定目标相匹配的分子。通过这种方式，我们可以有效地从成千上万个小分子中筛选出潜在的药物候选分子。

我们的大模型在2023年初产生了一些设计的小分子，而这些小分子的设计工作实际上在2022年就已经发表，甚至在2021年就已经投稿。许多公司总是跟风宣称大模型的强大功能，但我们在两年前就已经发表了相关文章，这才是真正的“创新”！

潘毅院士的分享为与会者提供了关于AIGC和大模型在生物医药领域应用的深刻见解，以及对未来发展方向的预测。他的观点不仅为行业提供了新的思路，也为AI技术在医疗领域的应用提供了宝贵的参考。