近日,阿姆斯特丹大学医学中心Ron Mathot团队发表论文《"ChatGPT in pharmacometrics? Potential opportunities and limitations." 》,探讨了ChatGPT技术在定量药理学中的应用潜力和局限性。
摘要
本研究旨在探究ChatGPT技术在定量药理学中的应用潜力,着重于开发标准半衰期VIII因子(注:A型血友病治疗药物)的药代动力学(PK)模型。
研究结果表明,ChatGPT可用于准确获取文献中的典型PK参数,用R语言生成的pop PK模型,并开发交互式Shiny应用程序将结果可视化。ChatGPT语言生成能力使得使用极少的编程知识即可开发R代码,并有助于找出和纠正代码中的错误。
虽然ChatGPT具有一些优点,如能够简化开发流程,但在定量药理学中的使用也面临着一些限制和挑战,包括人工智能生成数据的准确性和可靠性,以及AI的透明度和可解释性的缺乏。
总体而言,本研究展示了在定量药理学中使用chatGPT的潜力,但研究人员必须仔细评估其在满足特定需求方面的应用。
背景
多年来,人工智能(AI)在医学研究中的应用表现出巨大的潜力,可以提高药物研发、发现新的治疗目标和预测疾病结果的能力。
AI是一个泛指,包括机器学习、自然语言处理和深度学习等几种高级技术。这些方法可以从大量的数据中提取模式和洞见。最近人工智能研究中的一个令人兴奋的发展是OpenAI开发的ChatGPT2的公开发布。ChatGPT(生成预训练转换)的模型架构在实现强大的自然语言理解方面非常有能力,而其易于访问的图形用户界面导致它被广泛采用。
ChatGPT这样的大型语言模型(LLM)是在大量文本语料库上进行训练,以生成对查询的响应。通过投入大量人力标记生成的响应的质量,并重新训练模型以产生最佳响应,ChatGPT已经令人惊讶地产生出流畅准确的回应。除了公众对ChatGPT的使用的兴趣外,还有建议使用该模型来协助学生和研究人员编辑文本、回答问题、编写代码和在给定查询时找到相关的文献。
已经有些出版物讨论了LLMs在各种不同研究领域可能产生的影响,但是还不知道像ChatGPT这样的工具是否也可以支持相对较小的研究领域的研究人员,这可能是由于训练数据较少。
在本文中,作者研究了ChatGPT是否可以用于支持群体药代动力学(pop PK)模型的开发。作为一个使用案例,我们使用ChatGPT生成R代码,预测A型血友病患者中标准半衰期因子VIII(FVIII)的体内药物浓度。接下来,我们利用ChatGPT生成一个基于R语言的交互式shiny应用程序,用于解释模型和选择最佳的剂量。基于这个案例,我们旨在展示即使对R编程不熟悉的研究人员也可以得到可用于数据分析的有效代码。
方法
数据收集和模型开发
作者使用官方ChatGPT v3.5(https://chat.openai.com;OpenAI)来实现发送和接收回答。基于患者体重(BW)为70kg,利用模型进行查询,以提供FVIII的清除率(CL)和分布体积(V)的典型估计值。这些估计值被用来定义pop PK模型并模拟FVIII浓度随时间的变化。
以下是发送给ChatGPT进行数据收集的查询示例:
为了验证ChatGPT提供的典型PK参数的准确性,我们查阅现有文献,比较ChatGPT的响应与先前研究报告的值。我们还要求ChatGPT在提供PK参数的同时提供相关的文献信息。
接下来,我们通过ChatGPT生成描述pop PK模型的R代码,使用先前请求的典型PK参数(图1)。ChatGPT被迭代使用以根据用户对FVIII PK模型的偏好和要求进行不断调整。在每个步骤中,生成的代码被转移到R(v4.1.1. R Core Team 2023)中,并将预测结果可视化,以便为下一次模型修改提供帮助。
以下是发送给ChatGPT进行模型开发的查询示例:
(注:1. 异速生长换算通常用于PK参数,以说明体型的差异。2. A型血友病患者也产生内源性FVIII,因此在模拟的FVIII水平上增加了一个恒定的基线值。)
Shiny应用程序开发
为了可视化模拟FVIII水平随时间的变化,ChatGPT被要求基于PK模型创建一个Shiny应用程序。
该应用程序提供了一个模拟FVIII水平随时间变化的工具。用户可以输入患者的体重、基线FVIII水平、模拟持续时间和所需剂量等信息。此外,它还提供了一个表格输出,显示了几个时间点的模拟FVIII水平。
该应用还包括用于选择治疗窗的下拉菜单,虚线区域代表大手术(30-50 IU/dL)、剧烈体力活动(30-15 IU/dL)、高风险活动(5-15 IU/dL)和轻度活动(3-5 IU/dL)的治疗窗。FVIII的治疗窗水平是基于Berntorp等人的建议。
ChatGPT中使用了以下查询来开发Shiny应用程序:
使用ChatGPT开发人群PK模型的结果
根据ChatGPT提供的文献综述,体重为70kg的血友病A成年人FVIII的典型清除率(CL)在2.5-3.5 dL / h之间,具体取决于诸如年龄和健康状态等各种因素。
ChatGPT还建议,70kg患者的分布容积可以在40-60 dL之间。我们发现这些PK参数与先前的研究结果一致。
例如,Björkman等人的一项研究发现,基于70kg成年人,CL为2.3 dL/h,V为37.1 dL。另一项由McEneny-King和同事进行的研究估计,基于70kg成年人,CL为2.4-3.24 dL/h,V为35.4-46.2 dL17。
基于ChatGPT提供的估计值和以往的文献,我们选择分别传统的2.5 dL /h和40 dL作为CL和V的PK估计值。接下来,使用前面的典型PK估计,利用ChatGPT在R中生成pop PK模型。ChatGPT生成的基础pop PK模型的R代码显示在图1中。
ChatGPT不仅生成功能性的代码,而且还解释了它的工作方式。最初,R代码设置初始FVIII水平为零,假定没有给药。如果给药了,初始FVIII水平(代码中表示为C_0)为剂量除以V。然后,然后,我们迭代地要求ChatGPT向模型添加组件。ChatGPT了解如何使用异速生长标度将PK参数标准化为体重,以及如何将基线FVIII水平(F0)作为一个参数,如图2所示。
开发一个shiny应用程序来可视化FVIII水平
基于ChatGPT开发的PK模型,ChatGPT开发了一个shiny应用程序,用于基于患者特征模拟FVIII水平曲线。这个shiny应用程序允许调整患者的体重范围(从40到100公斤,每次调整1公斤)、基线FVIII水平(从0到40 IU/dL)、模拟的持续时间和期望的剂量(250到5000 IU之间)。
ChatGPT成功开发了一个Shiny应用程序,可用于模拟FVIII随时间变化的水平,并提供真实的预测。ChatGPT成功实现了在Shiny应用程序中所有要求的功能。此外,ChatGPT能够从单个查询中实现多个请求,如问题3b和4b。
它不能做什么
虽然ChatGPT成功生成了一个单剂量模拟的R代码,但我们的经验表明,它在模拟多剂FVIII时很难提供适当的代码,所生成的结果也不真实。
因此,在定量药理学研究中使用ChatGPT生成的R代码时必须小心谨慎。我们还要求ChatGPT为相同的模型生成NONMEM代码。尽管生成的代码类似于NONMEM控制流,但生成的文件包含多个错误和冗余,并且无法运行。
讨论
我们发现,ChatGPT不仅能够从文献中准确获得典型的药代动力学参数,而且能够使用群体药代动力学模型生成用于预测药物浓度的功能性R代码,以及开发交互式Shiny应用程序来可视化模型预测。
ChatGPT在R中生成了一个单房室pop PK模型,并根据用户规则更新了代码。通过使用ChatGPT在R中开发一个Shiny应用程序,不熟悉R和shiny的用户可以很容易地创建web应用程序来解释他们的模型。这两个应用程序都展示了如何在没有大量编码或编程知识的情况下使用ChatGPT。这可以显著减少开发时间和工作量,同时潜在地改善用户对此类应用程序的体验。
使用ChatGPT进行编程的另一个好处是它能够帮助开发人员识别和修复代码中的错误。ChatGPT可以为错误和其他编码错误提出可能的解决方案,这有助于没有经验的用户调试他们的代码。这个功能可以帮助简化开发过程,并提高R代码的整体质量。
对于与药代动力学相关的应用程序,使用ChatGPT也存在一些限制和挑战。例如,AI生成的数据的准确性和可靠性可能会受到训练数据中的偏见和知识差距或查询复杂性的影响,如当要求为更复杂的生物系统生成代码时。对于没有经验的用户来说,检测ChatGPT提供的响应中的错误可能会特别困难,错误可能会进入模型代码,从而影响下游的结果。此外,AI算法缺乏透明度和可解释性可能会引发伦理问题,并限制其广泛采用。
本研究中使用的ChatGPT v3.5的另一个实际限制是响应大小有限,可能会截断更长的代码块。这仍可能对需要完整准确的代码片段的用户构成挑战。虽然ChatGPT可能特别适合不熟练的程序员,但仍有必要仔细审查和编辑由ChatGPT生成的代码,以确保其正确性和完整性。未来版本的ChatGPT可能可以解决一些观察到的限制,包括截断更长的代码块。另一个需要考虑的限制是,ChatGPT似乎无法很好地生成NONMEM控制流,这是不幸的,因为NONMEM是定量药理学研究的金标准,改进这个功能可以极大地帮助学生学习如何使用它。这可能是由于公开可用的控制流的可用性有限,使得ChatGPT很难从中学习并生成准确可靠的NONMEM模型代码。
总之,在定量药理学中整合ChatGPT有潜力简化开发过程并提高研究人员的用户体验。我们认为在当前状态下ChatGPT不太可能取代定量药理学家。ChatGPT确实在帮助研究人员查找和解释信息、生成和帮助调试代码、以及培养新一代定量药理学研究人员方面具有巨大价值。随着ChatGPT的不断发展和改进,它有潜力成为定量药理学领域中更加有价值的工具。随着ChatGPT的不断发展,其他定量药理学家可能会找到其他创新方式将其整合到其工作流程中,并进一步增强其在定量药理学领域的能力。
注:人工校译,难免出错。有问题请及时后台留言呦~
本号原创或转载的文章均出于学习与交流的目的,无任何商业用途;原创文章如需转载,敬请联络!
【微信号|CP-Knowledge,或搜索“临床药理知识库”】