AIDD 能否成为新药研发的破局者？

Read Time: 0 Minutes

订阅 GLG 会议纪要资料库，您可阅读专家分享完整会议纪要，更有上千份各行业洞见待您发掘。

随着人工智能的理论和技术突飞猛进，其应用在各行各业不断扩展延伸。在制药领域层面，人工智能药物设计（AIDD）就为新药的发现与开发带来了极大助力。

AIDD 相比传统药物研发有何优势？人工智能在靶点选择、分子筛选、临床试验中，能发挥什么作用？该领域的竞争格局是怎样的？AIDD 是否能与 ChatGPT 或 AIGC 相结合？针对这些话题，GLG 格理集团邀请到专家团成员，圆壹智慧 Ainnocence Inc 创始人和 CEO 潘麓蓉博士 进行全面解析。以下为活动摘要。

Q1. 相比传统药物研发，AIDD 优势何在？

潘麓蓉：药物研发的起点是靶点识别，接着是分子筛选，然后是临床试验。

在此过程中，传统药物研发，其分子筛选须做大量测试，大概有几万到几百万的通量，时间跨度约为 3 到 6 年。如果引入 AIDD，理论上可代替 80% 左右的传统测试环节，经过虚拟计算或模拟实验后，只需拿高概率的分子（几十到几百个）做实验。理论上，AIDD从全蛋白靶点、全基因组学到生物大数据的体内药理学的尺度，都可以实现这样的高概率成药分子筛选。

另外，对于没有任何结构信息或无法做体内表达的靶点，只能在细胞层面或体内层面进行实验设置，没办法做大通量盲筛。此时，就需要通过 AI 的方法，运用计算技术找到药物研发起点。

从上述两方面看，相比传统药物研发，AIDD 能在效能提升上实现突破，面对一些无法解决的生物学问题，也具有特有优势。

Q2. AIDD 的发展路径及其潜力在何处？

潘麓蓉：AIDD 本质上有两条发展路径，物理驱动和数据驱动。

物理驱动的瓶颈在于可计算的尺度非常小，需要仰赖算力的大幅提升和计算机的硬件突破。但目前的技术环境，其计算精度和准确度难以接近生理场景的生物复杂度，无法满足药物研发所需的全面要求。

数据驱动则是通过机器学习或深度学习的方式，达到药物研发需求的精准预测。目前来说，其瓶颈在于如何有效利用已有药学大数据，这一点也可通过加入人工经验的校准来突破。基本上，无论从经济角度，还是可实现性角度来说，数据驱动都是大势所趋。

AIDD 的发展潜力方面，其实制药的各个环节，AI 都能有用武之地。具体而言：

靶点发现环节——也叫精准医学诊断，在 AI 建模的情况下，通过收集病人的数据，比如影像数据、电生理数据和生化指标，多组学等数据，利用多模态的学习，可不受单一学科限制，进行一体化的分析整理，做出更高维度的判断；
分子设计环节——过去完全是盲筛，现在可根据历史数据建模，进行有针对性虚拟筛选。不仅如此，还可利用 AI 技术，模拟人体环境，完全基于人体信息，直接进行设计。这样的话，可逐步放弃传统的动物实验环节。
临床实验环节——过去很多实验，分为临床一期、二期、三期，成功率大概低于 50%，但近10年运用更多的计算技术后，临床一期的成功率就已大大提高，一部分达到 80% 左右。也将会逐渐影响二期三期的成功率。

而当结合多个数据系统或 AI 系统，在较长流程上进行整体运用，会产生叠加效应，让系统性效率能有巨大提升。相比在单独环节运用 AI，其优势会更加明显。

另外，在整个细胞模拟、器官模拟以及人的生理模拟，AI 都有发挥优势的空间。所以，在生命科学基础学科的研究突破上，AI 也会有巨大潜力。

Q3. 从 AI + 医疗看，该领域的市场竞争是怎样的？

潘麓蓉：从 Biotech 行业来看，实际上有两类公司：平台型公司和产品型公司。平台型公司通过服务获得营收，也会做自己的前期产品，最大化平台价值。产品型公司主要提供临床最终产品，它可能不需要或没有自己的平台技术，是技术的集成者。

从当前市场格局来说，这两种公司在不同时期、不同地域，基于资本市场和技术成熟度的差异，会有一定的周期性。平台公司在欧美行业环境会更 Value 一些，中国环境可能对于产品公司更 Value 一些。当然，这也要看不同的经济周期，或许 5 到 10 年后会有转变。

目前的市场格局是有循环周期的，包括高潮期、低谷期和稳定增长期。当下，AIDD 的技术竞争大约处于高潮过后的时期，往后可能就接近低谷期了，也就是大浪淘沙的过程，但再往后是一个稳定增长期。随着 AI 的发展、数据的增长，以及软硬结合的融合程度增高，整个技术会越来越成熟。

Q4. AIDD 是否可能与 ChatGPT 或 AIGC 结合？

潘麓蓉：在 AIDD 这块，有两个方面可以使用 ChatGPT 的架构。

首先是他使用的预训练大模型的人工智能框架是通用的。在分子设计上，我们已经有了很多相关应用。底层原理上，生物分子其编码模式也就是一个序列，跟人类语言高度相似，所以对应算法也类似。比如，蛋白质是 20 个氨基酸的序列的排列组合，可以学习的模式实际上也就是字母间的顺序。字母的上下文，也就是其空间结构之间的关系，是可以被识别和学习的，使用类似人类语言的算法便可实现从生物分子序列到生物功能的预测。

其次是科研文献情报学。目前的 ChatGPT 在通用知识领域效果很好，在特定学科的应用还可以进一步深挖。在生命科学领域，其概念庞大、研究零散、数据模式比较多样，语言方面也有论文、专利等信息。在 ChatGPT 层面，可设置专业领域的版本，从而提高信息检索、概念关联以及某些推导过程的效率和智能程度。

关于作者

潘麓蓉博士，2021 年 4 月至今，在AI制药公司圆壹智慧 Ainnocence Inc 担任创始人和 CEO。此前在美国阿拉巴马大学伯明翰分校交叉学科中心担任计算科学总监。还曾在全球健康药物研发中心（GHDDI）、Ironside咨询公司担任要职。潘博士拥有化学、结构生物学、人工智能领域的复合型学术背景，在疾病生物学研究、药物设计领域的计算技术开发与应用方面，拥有超过 13 年的经验。

GLG 格理集团致力于打造全球知识平台，为需要专业洞见的商业决策者匹配具有一手经验的行业专家，助力他们以更加明确的目标和坚定的信心做出决策。本文作者曾参与 GLG 格理集团关于“人工智能药物设计（AIDD），新药研发的破局者？”的洞见访谈。如果您想与包括潘麓蓉在内的 GLG 专家库约 100 万专家中的任何一位交谈，请与我们联系。

*以上分析仅代表专家个人观点，格理集团不予置评或背书，并不负责文章中所涉观点的真实性、关联性或完整性。

订阅 GLG 洞见趋势月度专栏

输入您的电子邮件，接收我们的月度通讯，获取来自全球约 100 万名 GLG 专家团成员的专业洞见。