(报告出品方:西南证券)
研究报告内容摘要如下
本篇主旨在探讨AIGC相关概念及技术在医药产业方向上的潜在应用。AIGC突出创造性生产,依赖于多模型的技术融合。整体来看,AIGC的创造力发展归功于算法领域的技术积累,而ChatGPT或将成为我们未来更为智能时代的全新信息系统入口。
该模型的推出促进了机器视觉通用基础大模型的进一步研究,为图像分割领域的研究和应用提供更加完备的解决方案,也逐步让我们看到了更多的AIGC在医药医疗端应用的潜在可能。因此如下我们做了三方面的梳理。
1)AI医疗影像:进入发展快车道,辅助诊断为主
2)AI医疗机器人:手术、辅助、康复机器人皆具备较高临床价值
3)CDSS与病种质控:临床决策支持服务以人机交互为核心,AIGC拉升效率
4)AI健康管理:智能设备监测及分析个人数据,医疗科技乘风而起
自然语言处理赋予了AI理解能力和创作能力: NLP有2个核心的任务:分别是1)自然语言理解—NLU;2)自然语言生成—NLG。
自然语言理解:希望机器可以像人一样,具备正常人的语言理解能力。需要涉及:1)语言的多样性;2)语言的歧义性;3) 语言的鲁棒性;4)语言的知识依赖;5)语言的上下文。
自然语言生成:为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告 等。需要涉及:1)内容确定;2)文本结构;3)句子聚合;4)语法化;5)参考表达式生成;6)语言实现。
算法领域的技术积累助力AIGC
AIGC领域的技术包含了:生成对抗网络(GAN)、变微分自动编码器(VAE)、标准化流模型(NFs)、自回归模型(AR)、能 量模型和扩散模型(Diffusion Model)。
总体趋势来看,大模型、大数据、大算力是未来的发展方向。目前两个最常用的模型是 GAN 和Diffusion Model。
1. GAN (Generative Adversarial Nets)生成对抗网络:结构包含两个模型,一个是生成模型 (Generator,G),另一个是 判别模型(Discriminator ,D)。
2. Diffusion Model 扩散模型:扩散模型的生成逻辑相比其他的模型更接近人的思维模式,也是为什么近期 AIGC拥有了开放性 的创造力。本质上,扩散模型的工作原理是通过连续添加高斯噪声来破坏训练数据,随后通过反转这个噪声过程来学习恢复数 据。训练后,我们可以通过简单地将随机采样的噪声传递给学习的去噪过程来生成数据。
大语言模型(LLM) 是指使用大量文本数据训练的深度学习模型,可以用于生成自然语言文本或理解语言文本的含义。
大语言模型可以处理多种自然语言任务,基于大语言模型开发的ChatGPT或能够为用户提供信息系统入口/界面,同时可以管理计 算资源并支撑应用开发。
Meta AI 发布并开源图像分割基础大模型SAM,促进机器视觉通用基础大模型研究
Meta 在 4 月 5 日发布了机器视觉领域首个用于图像分割的通用大模型 Segment Anything Model(SAM)及其训练数据集 Segment Anything 1-Billion(SA-1B),并将其开源于 GitHub。该模型的推出旨在促进机器视觉通用基础大模型的进一步研 究,为图像分割领域的研究和应用提供更加完备的解决方案。
SAM 模型基于 Meta 在 2021 年发布的 Unified Vision 模型架构,并在此基础上进行了优化和改进。该模型采用了多尺度特征 融合和深度监督等技术,具有更好的图像分割效果和更高的鲁棒性。SA-1B 数据集是 Meta 开源的一个大规模的、高质量的图 像分割数据集,包含 10 万张图像和 100 万个标注,涵盖了人、动物、车辆、建筑等多种类别。
开源 SAM 模型和 SA-1B 数据集将为机器视觉领域的学术研究和产业应用提供更加丰富的资源和技术支持。通过更加广泛地应 用和改进 SAM 模型,将有助于推动图像分割技术在自动驾驶、医学影像分析、智能安防等领域的应用。
完整《AI医疗专题:从AIGC角度看医药产业图谱》(幻影视界)。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)