在2024全球湾区科技创新发展论坛上,深圳理工大学计算机科学与控制工程院创院院长、讲席教授、中国科学院深圳先进技术研究院首席科学家、深圳市重点实验室主任、美国医学与生物工程院院士潘毅发表了主题演讲——《AIGC大模型赋能生物医药》,结合生物医学应用,在大模型“热”的时代下给出“冷静”的思考,以及在人工智能赋能医疗行业的探索、突破和创新,代表了未来机器学习的新方向与人工智能技术的新成果。
当下,尽管多个国家都在布局大模型,中国也有如百度、华为等企业在这一领域有所建树,但未来的发展重点不应仅仅是开发更多的大模型,而应是如何更好地利用这些模型。
潘毅院士提到,华为的大模型是通过功能划分的,涵盖了视觉、自然语言等多个方面。他进一步阐述了行业大模型的概念,如煤炭、医疗等行业模型,以及更高层次的场景应用,例如在医疗领域,大模型可以用于治疗疾病、诊断指标和制药等。
从单一到组合,人工智能大模型加速演变
在2023年3月的一次访谈中,我曾指出大型模型的不可持续性,原因在于其高能耗和高昂的成本。当时我认为,对于特定领域,如专业模型、药物模型或诗歌创作模型,已经足够。如今,我们迎来了生物模型的突破,其中行业模型已经实现。同时,我提出了一个新的概念,即单一模型不足以应对所有问题,例如顺丰模型在处理法律问题时可能无法给出答案。我提出可以将三个小模型组合成一个大模型,类似于“三个臭皮匠,合成一个诸葛亮”。这种组合模型的优势在于成本效益高,因为它不需要训练数据。例如,当需要撰写一篇文章而小模型无法解决法律或医疗问题时,可以求助于ChatGPT这样的大型模型。目前无法解决的问题,可以在3秒钟内提出问题并得到答案。这种做法的好处在于节省成本。大模型可能需要数万美元一天,而文心一言、ChatGPT只需几秒钟和几块钱即可解决问题,与本地小模型结合使用将更加可靠。我的一位同学曾是微软中国区的负责人,他的大型模型的能耗仅为ChatGPT的四分之一。因此,未来模型之间的比较不仅在于质量,还在于能耗。能耗低意味着技术更先进。
“六驾马车”助力人工智能可持续发展
在当前的人工智能领域,我们通常讨论三大核心要素:数据、算力和算法。然而,我认为应该将人工智能的发展扩展为“六驾马车”,具体包括:大数据、优算法、强算力、赋知识、可解释性和低能耗。首先,大数据是基础,为人工智能提供丰富的信息来源。其次,优化算法是核心,能够提升人工智能的处理效率和准确性。再者,强大的算力是保障,确保人工智能能够快速处理复杂任务。
此外,赋予知识是关键,即将行业知识融入人工智能系统中,使其能够更好地理解和执行特定任务。例如,在顺丰快递中,通过赋予知识,系统能够不仅识别问题,还能解释问题的原因。可解释性是人工智能发展中的重要方面,它使用户能够理解人工智能的决策过程,从而增加信任和透明度。
最后,低能耗是人工智能可持续发展的必要条件。尽管大模型在处理能力上具有优势,但如果其能耗过高,甚至消耗掉整个城市的所有电力资源,那么这种模型将变得不切实际。因此,我们必须持续倡导和研究低能耗技术,确保人工智能的发展既高效又环保。
人工智能在医疗诊断中的潜力与挑战
在医疗应用领域,美国有一个案例,一名儿童的母亲带他咨询了十几位医生,但均未能确诊,也未提出有效的治疗方案。最终,她在ChatGPT上输入了孩子的症状,如感冒、鼻塞、发烧等,ChatGPT提供了一个症状分析和治疗方案。随后,她将这一诊断结果带给了医生,医生经过检查后确认方案有效,似乎准确无误,于是按照方案给孩子服药,孩子最终痊愈。这一案例说明,ChatGPT有时可能会出现错误诊断,但有时也能提供正确的建议。
上图中的这篇文章描述了医疗管理领域遵循癌症管理建议的情况,发现其中62%的建议是正确的,但也有错误之处。未来如何应用人工智能(AI)成为一个亟待解决的问题。与此同时,中国和美国在AI开发方面都有显著进展。例如,美国的GPT技术能够检测内容的真实性,防止篡改;而中国推出的AIGC X技术则能够实现内容的溯源,指出建议中的错误。我的学生在杭州成立了一家公司,开发的软件能够预测并识别面部是否经过替换,以及文件上的印章是否被篡改。这表明AIGC技术在内容生成方面表现出色,但同时也需要相应的规范措施。
提升自闭症问答系统性能:结合RAG技术与专业知识的创新应用
AIGC技术拥有广泛的应用领域。今天,我将介绍一个与顺丰相似的例子,即自闭症问答系统。当一位母亲在医院面临众多问题时,例如自闭症与哪些因素相关,若将这些问题输入到通用的AI模型如文心一言或ChatGPT中,得到的回答往往不尽如人意。这是因为这些模型在处理自然语言和专业问答方面存在局限性。然而,当我们采用结合了RAG(Retrieval-Augmented Generation)的大模型,并赋予其专业知识时,结果显著改善。我们使用了Llama模型,并整合了200篇与自闭症相关的专业文献以及一些标准的医院报告,这些文献和报告由专家提供。通过这种方式,我们得到了非常满意的结果。顺丰使用五个维度来衡量,而我们使用六个维度,包括可靠性与回答准确性。在145个通用问题中,我们的系统能够准确回答那些连ChatGLM3和ChatGPT3.5都无法回答的问题。
AI在药物筛选与设计中的创新应用与挑战
AI在制药流程中的应用同样昂贵且耗时,但其在各个阶段都具有潜在的应用价值,例如利用病例数据库和蛋白质数据库等。以药物筛选为例,一旦确定了靶点,即找到了治疗癌症的“锁”,接下来的任务是找到与之匹配的“钥匙”,即药物。如果一个“钥匙”能够打开多个“锁”,它可能成为一种万能钥匙,但同时也可能成为一种毒药。我们通过AI进行匹配,以确定哪些小分子与特定的靶点相匹配。例如,通过人工智能筛选,8888个小分子可以减少到421个,再进一步筛选到69个,最终有4个进入试验阶段,其中一个成功,这证明了我们的筛选方法的有效性。
在药物设计方面,大语言模型可以用于生成新的小分子。例如,将徐志摩和李白的诗歌输入模型,可以生成新的诗歌。类似地,在制药领域,通过打乱小分子的结构,可以创造出新的小分子,这些小分子可能与现有的中药或西药成分不同。我们拥有一个包含5万个分子的药库,通过模型可以产生6万甚至7万个新的分子。然而,如果没有筛选机制,这将导致信息过载。例如,如果生成5000首诗让某人审阅,这将是不切实际的。因此,我们使用AI进行筛选,以找到与特定目标相匹配的分子。通过这种方式,我们可以有效地从成千上万个小分子中筛选出潜在的药物候选分子。
我们的大模型在2023年初产生了一些设计的小分子,而这些小分子的设计工作实际上在2022年就已经发表,甚至在2021年就已经投稿。许多公司总是跟风宣称大模型的强大功能,但我们在两年前就已经发表了相关文章,这才是真正的“创新”!
潘毅院士的分享为与会者提供了关于AIGC和大模型在生物医药领域应用的深刻见解,以及对未来发展方向的预测。他的观点不仅为行业提供了新的思路,也为AI技术在医疗领域的应用提供了宝贵的参考。