译者按:我今年一直在关注垂直领域AI公司,正好近期Bessemer有一篇不错的文章讨论如何构建这样的企业,本文不只限于提到的医疗健康和生命科学,也广泛适用于其他例如金融、法律、教育等行业。
原文标题:《Six imperatives for AI-first companies》(https://www.bvp.com/atlas/six-imperatives-for-ai-first-companies)
作者:Morgan Cheatham,Steve Kraus
翻译并解读:信天创投管理合伙人蒋宇捷
以下是正文:
在医疗健康、生命科学等领域建立新一代AI公司需要什么。
变化是缓慢的,并且是永久性的——尤其是在医疗等复杂行业。就在五年前,对医疗AI的风险投资还处于新兴和探索阶段( https://www.bvp.com/news/our-deep-health-seed-program) 。五年过去了,一场全球性疫情之后,我们生活在一个勇敢而雄心勃勃的新世界,这个世界充满了对应用人工智能等革命性技术的无限热情。将这项技术指向医疗健康、生命科学等关键行业以前难以解决的问题是本世纪最大的机遇之一。
2022年,更广泛的公众见证了人工智能研究从实验室到生活的重大进步(https://openai.com/blog/chatgpt)。ChatGPT在短短两个月内就向全球超过1亿人普及了Transformer(https://www.businessinsider.com/chatgpt-100-million-users-milestone-meta-threads-mark-zuckerberg-2023-7?op=1)。曾经是一个新兴的研究领域,现在已成为技术的下一个范式平台,随之而来的是,投资者会问—如何在医疗健康、生命科学等领域建立新一代的人工智能公司?
人工智能优先(AI-first)公司致力于将人工智能作为一门科学来发展,而人工智能驱动(AI-enabled)公司则是实现和分发机器。这两种公司表型在不同层面建立护城河—人工智能优先的公司在硬件之上进行创新,而人工智能驱动的公司则在应用层面创造企业价值。
我们不能再将人工智能优先和人工智能驱动公司混为一谈。
对于创始人来说,了解自己正在创建什么样的公司对于招聘合适的人才、与观念一致的投资者合作、获得足够的资金以及部署可行的商业模式至关重要。与人工智能驱动的同行相比,人工智能优先公司需要深厚的人工智能研究敏锐度、有长远眼光的投资者、更强大的资本以及可能不那么传统的商业模式。
实际上,这种区别不在一个维度,不是0和1。
有影响力的公司将通过这两种方法建立,而且更多的公司将由人工智能驱动。不过,对于人工智能优先的公司来说,我们相信都是值得的:对技术堆栈从头开始的影响可以严格控制成本结构,提供不可估量的产品选择性,并具有更深的护城河。
到目前为止,最大的人工智能优先公司都是为横向应用构建的新玩家(例如,OpenAI、Anthropic、Perplexity),而大型科技产品的发布(例如,谷歌Bard(https://bard.google.com)、亚马逊Q( https://aws.amazon.com/cn/q) )则与之相反。有待实现的是垂直和特定行业平台(例如医疗健康和生命科学领域的平台),它们将展示大模型的扩展能力以产生现实世界的影响。
对于创始人来说,我们相信,在医疗健康、生命科学等领域,持久的人工智能优先公司将遵循这六大要务。
人工智能优先公司的六大要务
1.创造并保持数据优势
人工智能优先的公司对数据表现出永不满足的胃口,并采用创造性的手段进行可持续获取。然而,数据越多并不总是越好,因为研究人员观察到,在人工智能标度律(AI scaling laws)的背景下收益递减。因此,模型性能的长期差异化需要多方面的数据合成和治理方法,以及优化的模型架构。
数据策略必须与模型目的保持一致。
对于人工智能优先公司,数据策略必须与模型目的保持一致。支持旨在精通许多任务的通才基础模型所需的数据将与支持较小特定任务模型的数据截然不同。医疗健康和生命科学行业可能产生全球30%的数据( https://www.rbccm.com/en/gib/healthcare/episode/the_healthcare_data_explosion) ;然而,仅靠医疗健康服务的数据消耗可能不足以开发高性能系统。在数据生成中进行有意识的实验,再加上优雅的产品设计,便于在每次用户交互时进行模型训练,可以提高模型训练的数据质量。
人工智能优先公司考虑了五个关键标准来评估数据的护城河:
1.可扩展性:是否有可能积累足够多的资产来进行大规模模型训练?
2.连续性:数据集可以随时间推移重新采样吗?
3.专有性:数据访问的难易程度如何?
4.拟合:数据是否与给定的模型或任务相关并适用?
5.多样性:数据是否充分反映了未来的真实场景?
以下是人工智能优先公司的主要数据来源:
公开数据:公开数据是不言自明的:可以免费访问和开放供公众使用的数据集。这种类型的数据非常适合初始模型训练和基准测试,因为它具有广泛的可访问性,有时还具有多样性。公开数据为广泛的应用提供了丰富的信息源。然而,这些数据通常存在很高的偏向性,并且缺乏任务特异性。此外,由于这些数据集被广泛使用,并且可能已包含在大规模基础模型的训练集中,因此污染和过度拟合的风险值得注意,这可能导致在实际应用中或零样本或少样本任务中性能不佳。MedQA就是一个例子(https://huggingface.co/datasets/bigbio/med_qa),这是一种从专业医学委员会考试中收集的多项选择题的开源数据。尽管MedQA已被用作生物医学AI模型性能的基准,但迄今为止,将MedQA任务的高性能外推到现实环境中尚未得到很好的表现。
OpenEvidence是一家人工智能优先公司(https://www.openevidence.com),利用大模型解析生物医学全文资源,为医生级临床决策提供支持,以立即回答有关药物剂量、副作用、非正式咨询、治疗计划等问题。该平台能够通过自然语言界面高效查询公开的生物医学文献。
客户生成的数据:客户数据由人工智能模型的客户在其正常业务过程中生成。这些数据与用户需求高度相关,并反映了现实世界的用例,因此对于以动态和特定于上下文的方式训练AI模型非常有价值。客户生成的数据还可以提供连续性,从而可以开发最新且响应快的AI模型。然而,客户生成的数据可能缺乏多样性,因为它可能偏向于某些客户(例如,对农村与城市地区社区医院的医疗记录进行训练),并且如果合成技术证明不足,可能会引发隐私问题。客户数据训练成功的关键是在治理过程中从足够大和多样化的客户群中抽样。
Artisight是一家人工智能优先公司(https://artisight.com),开发了一套智能医院产品,利用医院客户的音频和视频片段的合成衍生品,在计算机视觉和基于文档的任务中训练大小模型,解决临床劳动力短缺和倦怠问题。
设计器数据:设计器数据集是通过特意的实验专门为模型训练用例创建的,通常在公开或客户生成的数据集中找不到。这些数据集是机器可读且可扩展的,并且被设计为高度具体和相关,从而填补了上述数据源的空白。设计器数据集对于下列应用特别有价值:标准数据集可能不足,实际设置无法通过特定机制或特定格式因子生成数据。尽管有这些好处,但创建设计器数据可能既昂贵又耗时。如果单独部署,这些数据集可能缺乏泛化性。
Subtle Medical是一家专注于成像加速的人工智能优先公司(https://subtlemedical.com),在15分钟内生成了数百万张不完美的MRI图像,这些图像后来被用于训练深度学习模型,这些模型可以在更短的时间内重建和消除医学成像检查的噪声。在实践中,不完美的MRI图像几乎没有临床价值;然而对于Subtle来说,这些图像训练了深度神经网络,为公司的技术创造了数据护城河。
合成数据:合成数据是设计器数据的一个子类型,通过从其他数据源采样模拟或统计模型生成,这在真实数据稀疏或敏感的环境中非常有用。合成数据还可以减少隐私问题。合成数据面临的挑战源于人们担心它可能无法准确捕捉真实世界数据的复杂性。确保合成数据的准确性和相关性通常是一项复杂的任务,这可能会限制其在AI模型训练中的有效性。
Unlearn.ai是一家专注于临床试验加速的人工智能优先公司(https://www.unlearn.ai),它构建了“数字孪生”或合成临床记录,能够准确、全面的预测患者在相关场景下的健康恢复状况。
带标注的数据:带标注的数据集使用特定的元数据或标签进行扩充,从而提供额外的上下文和详细信息。数据质量和特异性的增强使得标注数据特别适合监督学习任务,其中详细和准确的标签至关重要。然而,数据标注过程可能既费时又费钱,而且标注时也存在人为错误的风险,这可能会对模型性能产生负面影响。在医学这个既是艺术又是科学的领域,“基值(Ground-truth)”标签往往会注入主观性,特别是对于尚不存在客观生物标志物的临床诊断领域。前瞻性研究还证明了人工智能系统执行专家标记任务以缓解这些挑战的能力(https://www.nature.com/articles/s41586-023-06221-2#Sec2)。
PathAI( https://www.pathai.com) 和Paige.ai( https://paige.ai) 是专注于病理学的人工智能优先公司,利用人类病理学家通过强大的专家网络对组织病理学切片进行标注。
“反馈即数据”:反馈即数据是指人类反馈强化学习(RLHF),涉及使用人类用户反馈作为训练AI模型的直接输入。这种方法使模型能够适应复杂和微妙的现实世界场景,并与人类的偏好和判断更紧密地保持一致。许多AI优先公司作为使用的副产品创建用户界面,通过应用程序中的RLHF进行模型训练,与底层基础设施无关。但是,这种方法会受到人为偏见的影响,并且在可扩展性方面受到限制。人工智能模型的质量和有效性在很大程度上取决于所提供反馈的质量,而反馈的质量可能是可变的,并且难以标准化。基于模型的强化学习是当代研究的一个蓬勃发展的领域,它为其他模型提供反馈,可以提供更具可扩展性的微调系统。
Abridge是一家AI优先公司(https://www.abridge.com),为临床医生提供环境文档工具,利用临床医生对AI撰写笔记的反馈来提高跨专业笔记的准确性和质量。
不同的数据集可以而且应该发挥不同的作用。训练数据用于通过提供广泛而多样的信息基础来教授模型的基本模式,它与微调数据不同,后者更专业,旨在优化模型在特定领域或任务中的性能,并解决初始训练中可能忽略的任何缺陷或偏差。评估数据独立于训练集和微调集,对于测试模型泛化到新的、未知情况的能力至关重要。
人工智能优先的公司必须在数据质量和数量之间取得平衡,以优化模型性能。利用各种数据源的相对优势和劣势的多模态方法可能比单一策略能产生更持久的好处。
2.招募和赋能人工智能科学家
人工智能优先的公司需要“多语言”团队(https://www.bvp.com/atlas/roadmap-10-laws-of-healthcare#Law-10-Diverse-multilingual-teams-win),这意味着他们需要在人工智能研究方面非常有经验的科学家以及具有行业和商业专业知识的员工。团队的设计必须反映人工智能作为关键业务活动的进步。在医疗健康和生命科学领域可能采取临床医生与科学家和人工智能研究人员合作的形式,为给定领域设计具有上下文感知表示的模型。“口译员”对于多语种团队的成功至关重要—他们是少数拥有跨学科领域专业知识的人,例如医生信息学家,他们可以使用共通的语言来协调各个职能领域。基于这些原因,人工智能优先的公司也更有可能从学术或行业实验室附属机构中受益。Atropos Health是一家专注于医学真实世界数据生成的公司(https://www.atroposhealth.com),最初由Nigam Shah博士领导的斯坦福人工智能实验室分拆而来。
组织结构还必须反映出人工智能优先公司从最高层对人工智能的优先考虑。与人工智能驱动公司相比,人工智能优先公司的研发组织可能会在不同的汇报关系和领导模式下运作。人工智能优先的公司更有可能拥有具有深厚人工智能研究经验的首席科学家(CSO),人工智能研究人员和软件工程资源向CSO报告。人工智能驱动公司更有可能拥有接受过经典软件工程培训的CTO。下面是一个组织结构示例图,说明人工智能优先公司如何构建其研发团队。对于人工智能优先的公司,我们强调了专注于应用程序开发的传统软件工程组织和专注于方法开发和模型微调的人工智能研究组织的并行化。
人工智能优先公司的营销职能部门也将人工智能研究作为一项关键的业务活动。它们通过可访问的格式定期发布工作,例如同行评审的期刊(例如,《自然机器智能》-Nature Machine Intelligence(https://www.nature.com/natmachintell)或《新英格兰医学人工智能杂志》-New England Journal of MedicineAI(https://www.nejm.org/ai-in-medicine)),或在领先的AI会议上发表演讲(例如,NeurIPS(https://nips.cc)和ICML(https://icml.cc))。这些活动对于展示最先进的技术(SOTA)的进步至关重要,并为人工智能领域的进步做出广泛贡献。
3.支持灵活的AI堆栈
随着模型大小的非线性扩展,人工智能正在以指数级的速度发展。当这篇博客上线时,某些内容正在过时。人工智能优先的公司必须避免对人工智能堆栈做出僵化、不可逆转或单一的决策,这对生存至关重要。此外,对于单个团队来说,开发在各个方面都基于SOTA基准模型的工作可能很困难。取而代之的是,人工智能优先的公司可以利用一流的公开模型(开源例如在Hugging Face Hub上共享的模型(http://huggingface.co),和/或闭源例如GPT-4或Claude2.1)构建模块化的人工智能堆栈(https://www.bvp.com/atlas/the-evolution-of-machine-learning-infrastructure),将内部专有模型开发资源集中在堆栈层中,由于数据护城河,方法论知识产权或公司/附属实验室的其他研究产出从而构建明显的优势。
我们强调,开源模式在各行各业的重要性日益增加,尤其是在医疗健康和生命科学领域(https://www.nature.com/articles/d41586-023-03803-y),经过多年的封闭系统架构,透明度正在成为技术创新的核心价值。开源方法可以完全控制模型及其训练数据的所有方面,包括前瞻性更新。
人工智能驱动的公司可能更依赖现有的基础设施,例如GPT,以实现大多数与AI相关的产品功能。这些公司可能会在这些模型的基础上进行微调,但因此更有可能在产品功能方面达到天花板。通过在AI堆栈中进行更低层次的创新,人工智能优先的公司可以随着时间的推移享受更多的产品和功能选择。
此外,并非所有人工智能优先的公司都在构建基础模型。相反,许多公司专注于开发较小的专用模型,其特点是参数更少。这些模型已被证明可以通过以下方式挑战大模型标度律(https://arxiv.org/pdf/2001.08361.pdf):1)在特定任务上优于大模型,以及2)在与大模型结合部署时表现出卓越的性能。通过支持灵活的堆栈,人工智能优先公司可以享受大模型在协调使用小模型方面的优势 - 管理,协调或指导小模型队列以解决特定任务 - 类似于“AI项目经理”。从商业角度来看,小模型还具有其他优势,例如降低成本、降低延迟和提高可控性。
4.建立分销护城河
如果没有分销,一流AI模型产生的影响可能会以发表论文开始和结束。
人工智能优先和人工智能驱动公司都应该尽早寻求获得分销护城河或优势,这样产品就有可能在短期内与现有技术提供商集成或取代它们。然而,与人工智能优先公司不同,分销通常是人工智能驱动公司的唯一护城河。人工智能优先公司享有技术和分销两大护城河,这两者都有助于企业价值创造。
尽管直销可能是GTM的关键部分,但企业中人工智能优先产品的加速更新通常需要更具创造性的策略:
1.PLG:利用产品获取和留存用户(https://www.bvp.com/atlas/direct-to-clinician-how-product-led-growth-is-changing-healthcare-and-life-sciences)。
生物医学人工智能公司OpenEvidence(https://www.openevidence.com)与领先的医学出版商Elsevier合作(https://www.elsevier.com/about/press-releases/elsevier-health-partners-with-openevidence-to-deliver-trusted-evidence-based)推出了ClinicalKey AI,这是一款临床决策支持工具,通过自然语言界面部署Elsevier可信的循证医学信息。
2.伙伴关系:组织之间互惠互利的合作,例如首选供应商关系。
Abridge是一家专注于为临床工作人员提供工具的人工智能优先公司(https://www.abridge.com),与领先的电子健康记录提供商Epic合作成为环境文档解决方案的首选供应商合作伙伴(https://www.fiercehealthcare.com/health-tech/abridge-inks-epic-partnership-emory-healthcare-tie-its-generative-ai-tech)。
3.白标:在合作伙伴公司的产品或服务中重塑并销售人工智能优先技术。
Iterative Health是一家人工智能优先的精准胃肠病学公司(https://iterative.health),开创了胃肠道疾病的新型生物标志物,与领先的胃肠病学电子病历Provation建立了独家合作伙伴关系,以促进该专业的广泛分布。(https://www.provationmedical.com/iterative-health)
分销优势是关键,但这个问题的答案也是如此:谁买单?对于人工智能优先公司来说,商业模式仍然是一个悬而未决的问题,尤其是在生物医学领域。许多新兴公司正在利用传统的商业模式,如SaaS和基于交易的收入模式,但医疗健康利益相关者认为成本是人工智能落地的最大障碍(https://www.definitivehc.com/sites/default/files/resources/pdfs/AI-in-healthcare-study-2023.pdf)。医疗行业没有足够的资源或一致的激励结构来补贴向人工智能的过渡。据估计,医院每年仅在软件、硬件和人力资源等所有IT投资上要花费360亿美元。利益改革至关重要。
在此期间,我们期望人工智能公司能够按照Bessemer医疗十定律中的第五条实现商业成功(https://www.bvp.com/atlas/roadmap-10-laws-of-healthcare):展示财务和临床投资回报率。尽管对能够改进诊断的新兴方法感到兴奋,但我们担心,除非临床结果的改善能带来相应的经济利益,否则这些应用的落地速度将会非常缓慢。
5.在模型开发中以安全和道德为中心
随着人工智能渗透到公共和私人生活的方方面面,人工智能优先和人工智能驱动的公司必须努力保护人类用户的基本权利。对于在基础层进行创新的人工智能优先公司来说,对人工智能安全和道德的投资是不容谈判的。这些公司必须在数据保管方面保持谨慎和用心,并坚持不懈地致力于模型维护。人工智能优先的公司全面地采用了诸如持续性能监控、故障保护和人为干预覆盖、针对真实世界数据的定期重新验证以及概述人工智能关键局限性的用户培训等策略。
与健康人工智能联盟(CHAI)合作(https://www.coalitionforhealthai.org),我们认识到安全和道德始于模型开发设计的最早阶段,一直到监测和实际应用。
CHAI的核心使命是为医疗AI技术制定全面的指南和护栏。通过基于原则的方法,CHAI正在带头努力协调现有标准,并与医疗人工智能社区和政府行政命令指定的认证实验室合作,建立共同原则,作为创建和实施可信AI实践的基石(https://www.whitehouse.gov/briefing-room/statements-releases/2023/10/30/fact-sheet-president-biden-issues-executive-order-on-safe-secure-and-trustworthy-artificial-intelligence)。
这些原则包括:
·安全性:人工智能系统不得将人类生命、健康、财产或环境置于危险之中。
·问责制和透明度:参与AI系统开发、部署和维护的个人必须保持可审计性,最大限度地减少危害,报告负面影响,并沟通设计权衡。
·偏见管理的公平性:人工智能系统应有效管理偏见,以确保最大限度的减少特定群体的不同表现或结果。
·安全性和弹性:人工智能系统应能够承受不良事件或变化,并保持其功能和结构。
·隐私增强:人工智能系统应遵守保护人类自主性、身份和尊严的规范和实践,并遵守相关的隐私法律和标准。
6.通过解决实际问题赢得信任
虽然人工智能优先公司建立在数据基础上,但它们依靠信任茁壮成长。当利益相关者意识到他们的问题是由好奇心和同理心而不是技术解决方案来解决时,就会赢得信任。这是通过可靠性、准确性和对人类状况的尊重以及对社会价值创造的关注而获得的。
虽然人工智能优先公司建立在数据之上,但它们的繁荣却依赖于信任。
人工智能是我们解决社会问题的众多技术之一。人工智能的能力与人工智能创造价值的地方存在差异。
利用人工智能是否合理取决于问题、任务和行业。人工智能既是达到目的的手段—许多患者并不关心药物是由人工智能还是人类科学直觉发现的,他们关心的是有一种具有良好副作用的疗法可以治疗他们的病情—同时也是一种解决方案的工具:利用环境数据捕获重新设计临床医生的用户体验,以解决管理负担和工作倦怠。
与任何新兴技术一样,我们必须赢得使用它的权利,并且我们应该以以前的方式展示其优越性。人工智能优先公司肩负着艰巨的任务—他们必须进行技术创新,并展示出解决现实世界问题的能力,同时与治理社会的价值体系保持一致。
澄清事实
建立人工智能优先公司,尤其是在医疗健康和生命科学领域并非易事。然而,与人工智能驱动公司相比,人工智能优先公司的影响将更大,财务回报更高,护城河将更持久。尽管我们正处于见证人工智能优先公司的早期阶段,包括医疗健康和生命科学领域的行业特定机会,但人工智能优先公司的方法、能力和领导力的鲜明对比使它们与传统软件或人工智能业务明显区分开来。人工智能研究将继续成为人工智能时代机遇的命脉。当务之急是,风险投资和创业生态系统必须致力于将人工智能优先公司与人工智能驱动公司区分开来,并学习这些公司如何构建和规模化。当我们继续质疑人工智能作为解决问题代理的作用时,我们恳请创始人深入思考他们寻求建立什么样的人工智能公司,以及这对未来的道路意味着什么。也许最重要的是,让我们不要将清晰的视野误认为是短距离。这仅仅是个开始。
Albatross Venture
信天创投数字经济生态圈
点击关键词阅读详情
通用型
法大大 | 链上科技 | 司库立方 | 缔联科技 | 海蜂法务 |JINGdigital | 九科信息 | 趣云数据 | 巧思科技 | 心知科技 | 爱设计
垂直型
美味不用等 | 飞榴科技 | 云柚货运 | 十六进制 |
神驼科技 |4KMILES | 领骏科技 | 九章数据 |
豆沙包科技 | 劢微机器人 | 迈思科技 | 千巡科技
信天创投感谢您关注!
信天创投成立于2014年,立足于产业,聚焦数字化、绿色化的早期科技投资。目前基金管理规模为10亿人民币,投资项目包括法大大、兰度生物、司库立方、劢微机器人等。
微信号:avcapital
BP通道:Bp@avcapital.cn