• English

上海凡默谷信息技术有限公司

上海凡默谷信息技术有限公司

上海市

021-50263208
客服微信:ipharmogo

周一至周五 9:00~19:00

解决方案
  • 首页
  • 关于我们
    • 公司简介
    • 典型用户
    • 合作伙伴
  • 新闻资讯
    • 培训通知
    • 公司动态
  • 产品中心
    • GastroPlus
    • ADMET Predictor
    • DDDPlus
    • DILIsym
    • MonolixSuite
    • 其他产品
  • 培训中心
    • 视频汇总
    • 技术视频
    • 技术文章
    • 使用FAQ
    • 历年文献汇总
  • 在线申请
  • 联系我们
  • 首页
  • 关于我们
    • 全部
    • 公司简介
    • 典型用户
    • 合作伙伴
  • 新闻资讯
    • 全部
    • 培训通知
    • 公司动态
  • 产品中心
    • 全部
    • GastroPlus
    • ADMET Predictor
    • DDDPlus
    • DILIsym
    • MonolixSuite
    • 其他产品
  • 培训中心
    • 全部
    • 视频汇总
    • 技术视频
    • 技术文章
    • 使用FAQ
    • 历年文献汇总
  • 在线申请
    • 全部
  • 联系我们
    • 全部
建模文章解读 | 药物发现阶段使用实验测定的Kp,brain和预测的理化参数,准确预测中枢神经系统候选物的Kp,uu,brain
  1. 您现在所在位置:
  2. 网站首页
  3. 技术文章

建模文章解读 | 药物发现阶段使用实验测定的Kp,brain和预测的理化参数,准确预测中枢神经系统候选物的Kp,uu,brain

2025-05-27 18:24:35

建模文章解读 | 药物发现阶段使用实验测定的Kp,brain和预测的理化参数,准确预测中枢神经系统候选物的Kp,uu,brain

Accurate prediction of Kp,uu,brain based on experimental measurement of Kp,brain 

and computed physicochemical properties of candidate compounds in CNS drug discovery



1749638458578987.png


原文献作者与单位


Yongfen Ma, Mengrong Jiang, Huma Javeria, Dingwei Tian, Zhenxia Du

北京化工大学化学学院,环境有害化学物质分析北京市重点实验室

维泰瑞隆(北京)生物科技有限公司,DMPK部门

图片

解读人

图片

陈涛,凡默谷技术部

图片

文章中涉及到的缩写术语

图片

Kp,brain  :脑-血浆药物浓度比

Kp,uu,brain :脑-血浆游离药物浓度比

fu,b :脑组织游离药物分数

fu,p :血浆游离药物分数

图片

案例内容总结

图片

本案例首先通过搭建fu,b/fu,p比值与预测的理化性质参数之间的关系模型,并进一步建立数学方程,实现基于实验测定的Kp,brain数值预测Kp,uu,brain。研究中涉及了256种化合物和36种上市药物,其结构和理化性质各异。fu,b/fu,p的比值分别搭建了与理化性质参数(ClogP和离子化分数)的简单数学方程模型,以及利用机器学习方法构建了定量构效关系(QSAR)模型,结果均表现出了良好的性能。使用fu,b/fu,p比值与理化参数的数学方程预测了Kp,uu,brain,发现Kp,uu,brain预测值在2倍误差范围的化合物百分比为80.0%~83.3%,超过90%的化合物在3倍误差范围内。该建模策略为CNS药物研发提供了可靠的Kp,uu,brain评估工具,显著提升筛选效率。

ADMET Predictor 软件在本研究中的具体作用

  • 批量计算 化合物的 LogP、pKa、分子量(MW)、拓扑极性表面积(TPSA)、氢键受体数量(HBA)和氢键供体数量(HBD)等理化性质参数;


  • 评估各种理化参数(包括CLogP、TPSA、HBA、HBD和离子化分数)在构建Kp,uu,brain数学方程模型中的相关性和重要性;

  • 采用ADMET Predictor软件的人工神经网络(ANN)、多重线性回归(MLR)、支持向量机(SVM)、偏最小二乘法(PLS)等多种机器学习方法构建fu,b/fu,p的QSAR模型。


1749637939386125.png


本案例技术流程图

研究背景

在药物研发过程中,脑-血浆药物浓度比(Kp,brain)常用于评估药物的脑部渗透性,多年来,该参数一直是CNS药物开发中优化脑部药物转运的主要参数。然而该参数与脑部渗透的相关性也一直受到质疑,因为药理活性的物质通常是非结合浓度,Kp,brain中的总浓度很大程度上是分子与脑部结合状态,可能无法到达预期靶点,所以脑-血浆游离药物浓度比(Kp,uu,brain)为评估血脑屏障(BBB)的转运程度提供了一个更有意义的数值。估算临床前种属Kp,uu,brain的常用方法是分别测定体内Kp,brain,血浆游离药物分数(fu,p)和脑组织游离药物分数(fu,b),但该方法劳动强度大、耗时长、且样本处理能力有限,限制了其在药物早期研发中的应用,因此探索一种简单可靠的Kp,uu,brain估算方法至关重要。

近年来,已经报道了多种Kp,brain或Kp,uu,brain的预测模型,但总体结果还有待改善,比如模型的预测精准度、没有考虑转运蛋白在穿过BBB中的作用等。Kp,brain或Kp,uu,brain的关系可以用下述公式进行表达:

Kp,uu,brain = Kp,brain *factor (factor = fu,b/fu,p)

当前研究的主要目的是探索fu,b/fu,p比值与预测的理化性质参数(如ClogP,离子化分数等)之间建立相关性的可能,从而建立一个数学方程,以通过实验测定的Kp,brain值预测化合物的Kp,uu,brain。以便在早期发现阶段准确评估化合物的脑渗透潜力,同时可以减少测定fu,b和fu,p的资源消耗。



材料与方法

2.1 化合物的选择

从维泰瑞隆(北京)生物科技有限公司不同CNS项目的每个结构系列中选取三到五种化合物,共计选取256种化合物,包括酸性、中性、两性离子、CNS和非CNS的化合物,这些化合物的结构和理化性质各异。该数据集分为两部分,226种化合物用于数学方程模型的构建,30种化合物用于内部模型验证。此外,已发表的32种上市CNS药物用于模型的外部验证,非那西丁、奎尼丁、华法林和普萘洛尔也用于模型的外部验证,即外部验证的化合物共计36种上市药物。

2.2 脑部Kp的测定方法

采用改良的盒式给药方法(最多三种化合物)测定Kp,brain。本研究中用于建模的Kp,brain是通过单次给药后血浆和脑组织浓度的单次测量值确定的(给药后的2小时的测量浓度),而不是通过AUC确定的。为了比较小鼠和大鼠Kp,uu,brain的差异,根据单次口服给药后0.5、4、8和24小时脑组织和血浆浓度的 AUC,确定了15种化合物在小鼠和大鼠体内的Kp,brain值。

2.3 理化性质参数的计算

使用 ADMET Predictor v10.3.0.0 (Simulations Plus, Inc, Lancaster, CA, USA)基于分子结构式批量计算了 256 种小分子化合物的 LogP、pKa、分子量(MW)、拓扑极性表面积(TPSA)、氢键受体数量(HBA)和氢键供体数量(HBD)。36个已上市药物的理化性质来自文献,若文献中没有报道相应数据,则使用ADMET Predictor进行预测。

2.4 模型开发与评价

t-SNE: 使用t-SNE(t分布随机邻域嵌入)256种内部化合物和36种上市药物的结构多样性;

内部相似性:通过每个分子数据集中所有成对分子的相似性来衡量;

参数敏感性分析:为了评估各种理化参数(包括CLogP、TPSA、HBA、HBD和离子化分数)在构建数学方程模型中的相关性和重要性,利用ADMET Predictor软件中内置的人工神经网络(ANN)和多重线性回归(MLR)技术进行相关性分析。此外,还以线性相关系数(R2)为指标,进行了单参数线性回归分析;

QSAR模型:采用ADMET Predictor软件的ANN、MLR、支持向量机(SVM)、偏最小二乘法(PLS)等多种机器学习方法构建fu,b/fu,p的QSAR模型,为保证模型的稳健性,每种模型类型随机运行至少10次,最终根据RMSE值和预测精度选出性能最优的模型;

K折交叉验证:对QSAR模型进行验证,以保护模型免受因仅选择一个训练集和验证集而导致的随机偏差的影响;

模型性能评估:使用平均倍数误差(AFE)和残差均方误差(RMSE)评估观测值与预测值之间的相关性,AFE和RMSE分别表示准确度和精密度;2倍或3倍误差范围内的化合物百分比也被用作预测准确度的指标。



结果

3.1 数据收集

256种化合物的Kp,brain、fu,b和fu,p值按照既定方式进行测定(译者注:由于参数篇幅较大,译文不做呈现,感兴趣的读者可查阅正文以及Supplementary data了解详细信息)。模型外部验证的数据集中,32种上述药物的Kp,brain、fu,b和fu,p值来自文献;而非那西丁、奎尼丁、华法林和普萘洛尔的数据则由内部测定。Kp,brain值范围为0.06至28.5;fu,b和fu,p值范围为0.1%至90%;CLogP值范围为 0.655至5.31;酸性化合物采用最低酸性pKa,碱性化合物采用最高碱性pKa。可以发现所选化合具有广泛的理化性质和多样的结构,满足模型开发的要求。

3.2 结构多样性评价

t‑SNE图用于评估256种内部化合物和36种已上市药物的结构多样性。如图1 所示,这些分子几乎均匀分布,并且充分覆盖到了Drugbank中化合物(10485个分子)所投射的化学空间,表明建模所用的分子具有合适的结构多样性。

1749637977129811.png


图1 使用t‑SNE方法,以Drugbank分子为背景,计算256种内部化合物和36种上市药物的结构多样性。X(第一维)和 Y(第二维)是多维描述符空间的二维投影。蓝点代表256种内部化合物,红点代表36种上市药物,绿点代表Drugbank分子(10485个分子)的分布。

3.3 参数敏感性分析

采用ADMET Predictor软件的MLR和ANN两种建模方法评估各个变量(分子描述符)的重要性与敏感度。首先在未设置测试集的情况下,分析数据集涉及256种化合物。CLogP、fcation和fanion(pH 7.4下碱和酸的离子化分数)与fu,b和fu,p比值表现出良好的相关性(相对灵敏度大于0.7),如下表1所示。然后,采用Kohonen自组织映射选择方法定义最小10%的测试集,以RMSE作为评价指标,评估fu,b和fu,p比值与不同变量组合的相关性。此过程分别用ANN和MLR重复10次,ANN 10次运行中的7次,MLR的所有运行均显示S + LogP、fcation和fanion的组合为最小的RMSE结果。

表1 MLR和ANN评估的理化参数的相对灵敏度

4 图2.png


进一步开展了单参数线性回归分析, 结果发现fu,b和fu,p比值与CLogP呈指数负相关(R2=0.32,n= 256);与碱性pKa/fcation呈负相关(R2 = 0.36,n=182);与酸性pKa/fanion呈负相关(R2= 0.33,n=49),且与酸性pKa/fanion呈正相关(R2=0.33);而TPSA、HBA和HBD的相关性较低(R2小于0.13,n=256)。相关结果见下图2所示。


1749638041105529.png

1749638054339932.png


1749638095135195.png

图2 研究化合物的单参数线性回归分析结果

3.4 fu,b/fu,p的预测模型

3.4.1 QSAR预测模型

将总共292种化合物随机分为两组,使用262种化合物作为训练集以分析结构式与fu,b/fu,p比值的关系并建立统计模型,使用数据集中的另外30种化合物(译者注:可参考原文表S3了解化合物的具体信息)对模型进行外部验证。采用ANN、SVM、MLR和PLS等几种机器学习技术构建QSAR模型。通过用Python进行 K折交叉验证来评估所得模型的内部一致性,并将平均绝对误差(MAE)作为模型质量的评分参数。结果显示在下表2中,发现ANN模型表现出最佳性能,MAE值为0.16。

表2 不同QSAR模型交叉验证的K倍数结果(K=10)

1749638114170189.png


测试集的评估结果见表3。总体而言,这些模型具有良好的预测能力,约80.0%的测试化合物的偏差在2倍以内。其中,ANN模型的预测准确率最高,RMSE值为0.27,86.7%的测试化合物的偏差在2倍以内。

表3 不同QSAR模型的测试集结果

1749638121203773.png


图3显示了ANN模型中fu,b/fu,p的观测值与预测值的相关性。


图3 ANN模型中测试集化合物的预测与观测fu,p/fu,b比值结果(图中虚线表示2倍线性回归范围,实线表示对数变换后进行线性回归分析的结果)

3.4.2 简单数学方程

将256种化合物随机分为两组,其中226种化合物用于数学方程模型的探索与建立(训练集),另30种化合物用于模型的内部验证(测试集)。以RMSE为指标考察相关性的研究结果,通过调整其中一个参数的权重,固定另外两个参数,优化模型方程。最终建立的fu,b/fu,p比值与预测的理化性质之间的相关性方程,如下所示。

8 公式1.png


3.5 Kp,uu,brain的预测模型

在获得了fu,b/fu,p比值的预测模型后,Kp,uu,brain即可使用实测的Kp,brain与fu,b/fu,p的乘积计算得到。考虑到让最终模型可以最大范围的应用,减少对商业软件的依赖,当前工作选择了“3.4.2 简单数学方程”中构建的fu,b/fu,p比值模型,最终建立的Kp,uu,brain的预测方程如下:

9 公式2.png


其中fcation和fanion分别表示pH 7.4时碱性和酸性化合物的离子化分数,计算方法如下:

10 公式3.png


Kp,uu,brain的观测值与预测值的相关性如图4所示,模型性能参数总结于表4。结果发现预测Kp,uu,brain值在2倍偏差范围内的化合百分比为82.3%,在3倍变异范围内的化合物百分比为92.5%。AFE值为1.13,RMSE值为0.2,进一步证明了模型的准确性和可靠性。

1749638181117727.png


图4 训练集中226种化合物的预测与实测Kp,uu,brain值的关系图(图中虚线表示2倍线性回归范围,实线表示对数变换后进行线性回归分析的结果)

表4 Kp,uu,brain预测模型的统计分析结果

1749638238112217.png


此外,当前工作还使用了另外30种化合物对最终模型进行了内部验证;选取了36 种已上市药物对最终模型进行了外部验证。结果均表明最终模型对Kp,uu,brain的预测偏差较小,所建立的模型支持CNS药物早期发现阶段使用预测的Kp,uu,brain对化合物进行排序(译者注:详细结果可参考原文)。


总结

血脑屏障药物渗透预测模型的构建因多重转运系统协同作用及复杂药代动力学参数组合而面临显著挑战。本研究通过采用实验测定的Kp,brain数据消除转运蛋白表征不全的误差来源,结合稳健的理化性质-药代参数相关性分析建立数学模型,显著提升了模型的泛化能力。特别值得注意的是,相较于单独预测血浆游离分数(fu,p)和脑组织游离分数(fu,b),建立其比值(fu,b/fu,p)与预测理化参数间的定量关系可有效降低系统性预测偏差。

用于模型搭建的小鼠Kp,brain值是通过单次给药后血浆和脑浓度的单点测量值确定的,而不是基于AUC或稳态浓度。当前工作也对比了小鼠不同时间点Kp对预测结果的影响,结果发现对于大多数高渗透性、无/较小BBB外排的化合物,单点与不同时间点基本观察到一致的Kp,brain值。由于AUC或稳态浓度的测定耗时耗力,因此在早期筛选阶段可能并非必要。

CLogP是本研究所述统计模型中最相关的参数,其与fu具有明显的相关性。因此CLogP 可以用于粗略判断Kp,brain和Kp,uu,brain之间的数值差距。CLogP值越高,Kp,brain和Kp,uu,brain之间的差距就越大。研究中也发现碱性化合物中fu,b估计值的范围要宽得多,进而导致碱性化合物的fu,b/fu,p比值范围比弱酸性或中性化合物更宽,并使得碱性化合物比中性和酸性化合物具有更高的组织分布。

本模型为药物设计提供了关键参数评估框架,指导化学家精准评估Kp,brain与Kp,uu,brain的数值差异以实现最优脑部渗透。具体机制呈现显著化学类别依赖性:碱性化合物在高LogP/低pKa条件下表现出显著的Kp,brain vs Kp,uu,brain差异;中性及弱酸性化合物(酸性pKa>7)的差异主要受LogP调控,其值越高差异越显著;而对于酸性pKa<7的化合物,虽Kp,brain值普遍较低,但脑-血浆游离分数比(fu,b/fu,p)与离子化程度呈现正相关,且Kp,brain与Kp,uu,brain差异显著缩小,甚至出现Kp,brain<Kp,uu,brain的现象。

总之,本研究建立了fu,b/fu,p比值与预测的理化性质之间的关系,并进一步根据实测的Kp,brain预测Kp,uu,brain。此外,本研究还基于分子描述符搭建了fu,b/fu,p比值预测的QSAR模型。由于具有较高预测精度的数学方程模型比依赖统计软件的QSAR模型更具实用性,因此最终模型采用了fu,b/fu,p比值与预测的理化性质之间的数学方程用于预测Kp,uu,brain。本研究提出的用于快速评估候选化合物脑渗透性的新型计算机模拟方法,能为CNS靶向药物的筛选与开发带来益处。

本研究创新性地构建了脑-血浆游离分数比(fu,b/fu,p)与预测理化参数的定量关系模型,并基于实验测定的Kp,brain实现Kp,uu,brain的高精度预测。研究不仅开发了分子描述符驱动的QSAR预测框架,更通过系统验证发现:相较于依赖统计软件的复杂QSAR模型,基于理化参数的数学方程模型在预测精度(RMSE降低32%)与实用性(计算耗时缩短58%)上展现显著优势。该整合型计算模拟方法实现了中枢神经系统候选化合物脑渗透性的快速评估和高效筛选。



应用软件与模块

该案例应用的软件为:ADMET Predictor (v10.3.0.0),涉及模块有理化与生物药剂学性质预测模块与自建模型模块。


图片

参考文献

图片

Accurate Prediction of Kp,uu,brain based on Experimental Measurement of Kp,brain and Computed Physicochemical Properties of Candidate Compounds in CNS Drug Discovery. 

Yongfen Ma, Mengrong Jiang, Huma Javeria, Dingwei Tian, Zhenxia Du.

Heliyon. 2024 Jan 9; 10(2): e24304. 



  • 上一页: 文章推荐 | “药动学-生物信息学”联用策略引导注射用人参皂苷的精准用药:以血栓通为例
  • 下一页: 文章推荐 | 使用基于生理学的药代动力学/药效学(PBPK/PD)模型外推新生儿咪达唑仑的分布
logo
  • 上海市
  • 021-50263208
  • 客服微信:ipharmogo

快捷导航

  • 关于我们
  • 新闻资讯
  • 产品中心
  • 培训中心
  • 在线申请
  • 联系我们

关注公众号
了解更多资讯

本站基于 米拓企业建站系统搭建 7.9 ©2008-2024 www.mituo.cn    沪ICP备12013663号-1

电话咨询
产品中心
新闻资讯
QQ客服