突破计算方法为药物发现

全文

迷你回顾

突破计算方法为药物发现

朱利亚化学西蒙Brogi^*

欧洲药物发现与发展研究中心（Natsyndrugs）和生物技术，化学和药房系，锡耶纳大学，通过Aldo Moro 2，意大利53100锡耶纳

*通讯作者:sione Brogi，欧洲药物发现和开发研究中心和生物技术、化学和制药系，锡耶纳大学，Via Aldo Moro 2, 53100锡耶纳，意大利，电话:+39-0577-234389;电子邮件:simonebrogi1976@hotmail.com; brogi32@unisi.it

在网上方法学已成为现代药物发现过程中的关键部分。自其诞生以来，计算技术已被证明可加速特定药物靶点的命中选择，并对药物发现的多个阶段（即药物优化）做出重大贡献[1]。因此，在网上药物设计和发现正处于不断快速发展的状态，这是由于：（i）计算机科学的进步导致了功能强大、价格合理的超级计算机的产生，可用在线工具、软件和数据库的扩散以及更可靠算法的发展；（ii）开发新的生物靶点表征实验程序（即X射线晶体学和核磁共振波谱）；（三）提高对药物作用分子基础的认识。

在此，我们分析了最相关的计算机辅助药物设计(CADD)突破。将讨论在药物发现过程中具有不同潜在应用价值的各种计算方法(图1)，并对其进行最后的改进在网上审查的工具和方法。

图1所示。计算机辅助药物设计(CADD)流水线。

基于配体和基于结构的药物设计方法

药效建模，三维定量构效关系（3D-QSAR），比较分子场分析法（CoMFA）和比较分子相似性指数分析（指数分析）仍然基于配体（LB）的首选快速虚拟筛选方法（VS）程序。它们特别强大时所研究蛋白质的三维（3D）结构是未知的[2-4]。VS is routinely employed by academia and pharmaceutical companies to identify novel chemical entities using public (e.g. ZINC database [5]), commercial or proprietary 3D-databases, with the possibility to screen billion of compounds in a short time, in order to reduce drug discovery costs [6]. The large amounts of available positive information (i.e. biological and structural data) allow the use of large dataset of known characterized compounds also for the development of 3D-QSAR models. These are crucial information for relating the structural and/or physicochemical properties of compounds to their activities in order to obtain more robust statistical在网上预测新型化学实体[7]活性的模型。CoMFA和CoMSIA是生成3D- qsar模型的强大工具，可以将一组分子的生物活性与其三维形状、静电和氢键特性关联起来。这种关联是由一系列叠加构象推导而来的，每个分子对应一个构象。计算每个构象周围的分子场，得到的3D模型可用于VS协议，例如SYBYL-X Suite (Certara USA, Inc.， Princeton, New Jersey, NJ)。

因此，在生成QSAR模型和使用公共可用数据库(考虑理论或实验数据)开发统计软件包方面的专业知识，使修正的结构-关系模型的实现成为可能。以下是一些重要的例子:

3D定量结构-选择性关系(3D- qssrs)模型[8,9]。在这种方法中，通过Phase软件(Schrödinger, LLC, New York, NY)，经典的3D-QSAR以化合物的选择性指数为因变量，而不是对选定目标(大麻素受体2)的活性为因变量，进行了轻微的修改。这允许开发一个全面的结构选择性而不是结构-活性模型。该模型成功地用于合理设计大麻素受体2的高选择性配体[8,10];
多目标定量构效关系(mtQSARs)模型。这对于使用化合物[11]的大而不相关的数据集同时估计对不同生物靶点的活性是有用的;
三维定量结构-性质关系(3D- qsprs)模型[12]。具体来说，QSPR可以在不同的子领域聚类，包括定量结构-反应性(QSRRs)， -毒性(QSTRs)， -色谱(QSCRs)， -生物降解性(QSBRs)， -电化学(QSERs)关系[12]。

在过去的十年中，许多科学贡献出现在文献报告改进的QSAR方法。这些结构-关系模型的进展对于合理的药物设计和预测配体的不良效应是非常有用的hERG K⁺通道的亲和力。hERG K⁺信道是在由中枢活性药物靶向的公知的抗靶负责心脏毒性。事实上，用小分子的相互作用hERG K⁺频道是药物企业与药物开发过程有关的主要问题之一。近年来，由于相关活动，近年来，包括Astemizole，滴注醇，三丁胺，Lidolazine，Sertindole，CisaPride和氯丙嗪的销售药物hERG K⁺通道。在此背景下，生成一个充分的3D-QSAR模型基于hERG K⁺通道阻滞剂可以帮助合理设计新的潜在生物活性药物hERG K⁺通道的亲和力。

当已知配体复合物中靶点的三维结构信息时，基于结构的(SB)药物设计方法有助于推导SB药效团模型，包括排除体积(配体无法定位的三维空间部分)。生成SB药效团模型最常用的软件有:e-Pharmacophores，实现在Maestro套件(Schrödinger, LLC, New York, NY)， LigandScout (Inte:Ligand GmbH，维也纳，奥地利)，Catalyst，在Discovery Studio (Accelrys, Inc, San Diego, CA, USA)和SB药理学，在Molecular Operating Environment (MOE) (Chemical Computing Group’s (CCG)， Montreal, QC, Canada)实施。其中，e-Pharmacophores方法通过生成能量优化的SB药效团，实现了配体和结构基础方法的优势，可用于快速筛选数十亿化合物。事实上，合成生物学模型被用于大规模化学数据库的筛选过程。正如关于LB方法的报道，实验过程的进展和最近CPU性能的改进，以及大型公共3d -化学库的可用性，都促进了这种计算方法的发展。有趣的是，SB药效团建模的相关进展表现为使用多个SB药效团模型，这些模型是利用与不同配体的复合物中感兴趣的蛋白质的可用晶体结构，在VS协议中建立的。SB模型可作为筛选化学库的顺序过滤工具。或者，它们可以结合在一个包含SB药效团模型中，考虑到配体与受体之间最相关的相互作用，从而生成一个综合SB药效团[13]。在这两种方法中，多种SB药效团模型可以用于VS或用于合理的配体设计，以识别新的化学实体或优化现有的靶点。 Likewise, LB and SB methods can be combined for obtaining more reliable hybrid computational protocols. Following this approach a performance increase in retrieving active molecules for a given target has been observed [2].

药物设计中分子对接和蛋白质灵活性的挑战

在分子对接技术方面，近年来在分子对接技术方面取得了重要进展在网上对接算法和评分功能可以生成受体-配体配合物的结构;它们可以对化合物进行排序，并可以使用特定的算法估计结合能/亲和力。因此，分子对接是最常用的工具，可以直接筛选大型化学数据库到选定的生物靶点的结合位点，可以应用于广泛的不同临床相关蛋白，从人、寄生虫、病毒或其他生物体。上述过程被定义为高吞吐量对接(High Throughput Docking, HTD)，迄今为止可以应用于广泛的不同目标[14,15]。这多亏了计算能力、分子模拟算法、越来越多可用的实验3D蛋白质结构以及使用新型同源建模技术(即使用多个模板生成的模型)生成的稳健分子模型的最新进展。近年来，分子对接也被应用于识别和验证活性化合物的潜在靶点(目标垂钓)[16]。考虑到现有晶体结构的数量和表型筛选方法的优势，生物活性化合物对相关靶点的HTD，结合结合自由能的评价，可以帮助确定已知生物活性化合物的未知靶点。经典的对接程序，如Glide (Schrödinger, LLC, New York, NY)， Autodock，配体对接遗传优化(GOLD)(剑桥晶体数据中心，Cambridge Crystallographic Data Centre, Cambridge, UK)，可用于目标垂钓程序。此外，Maestro套件(Schrödinger, LLC, New York, NY)已经实现了一个自动化的程序，即虚拟筛选工作流(VSW)，用于考虑不同的蛋白质进行多重对接，并结合所选配体的结合能量评估。此外，不同的在线工具可用于识别给定小分子的潜在靶标(如SwissTargetPrediction[17])。 These tools consider the similarity of the molecule without targets with compounds known to be active against specific ones. Despite the great improvement in amount and quality of data available in the Protein Data Bank (PDB), in terms of number of proteins, resolution of crystals, and in general in terms of reliability of the protein structures, several drawbacks for target fishing have been recently reported (i.e. improper pose predictions, scoring failures, binding site-ligand protonation interdependence, problems associated with generation of heterogeneous collection of binding cavities) [18]. Furthermore, modified molecular docking simulations aimed at improving the performance of standard molecular docking methods, continue to appear in the literature. A technique called “ensemble docking” was recently developed with the purpose of including protein flexibility in molecular docking calculation using multiple protein conformations. Consecutive docking calculations of each ligand into different conformations of a target receptor, represent a valuable method to mimic the dynamic nature of the biological target. In general, the performance of the “ensemble docking” technique is superior to that reported for docking into a single receptor conformation [19]. Another modified docking technique aimed at taking into account the protein flexibility is the Induced Fit Docking (IFD). This latter encompasses various steps such as ligands and proteins preparation and molecular docking, and induces conformational changes in the binding site to accommodate the ligand. In fact, this technique exhaustively identifies potential binding modes and related conformational changes by side-chain sampling, and backbone minimization in a selected radius around the poses found during the initial docking stage of the protocol [20]. Interestingly, a modified IFD protocol combining molecular docking with a rule-based approach to intrinsic reactivity has been developed for predicting potential sites of metabolism (soft spots) for a given ligand. This technique is useful for designing optimized derivatives which bear functionalities able to mask the identified soft spots. The IFD procedure calculates the accessibility degree of compounds to the cytochromes P450 (CYP) reactive center. The reactivity rules have been parametrized in P450 Site of Metabolism Prediction software (Schrödinger, LLC, New York, NY). The reactivity is predicted with a linear free energy approach based on the Hammett and Taft scheme, where the reactivity of a given atom is the sum of a baseline reactivity rate and a series of perturbations determined by the connectivity. This procedure is very useful for designing ligands with improved metabolic stability [21]. Further advances in docking calculations have been recently carried out by estimating从头开始用于改进对接预测的给定配体的电荷。量子力学极化配体对接(QPLD)工作流程，在Maestro套件(Schrödinger, LLC, New York, NY)[22]中实现，旨在通过替换由量子力学(QM)计算得到的电荷来改进分配给配体原子的部分电荷。采用量子与分子力学(Quantum and Molecular Mechanical, QM/MM)混合方法进行计算，其中蛋白质被认为是MM区域，配体被定义为QM区域。这样就考虑了受体对配体电荷的极化，并根据这些QM电荷进行配体的重新对接。QPLD代表了混合QM/MM评分方法的最新应用之一，该方法已迅速成为研究生物分子体系中化学反应活性的最流行的工具之一，允许对键形成和-破坏[23]进行建模。然而，执行高级QM计算的高计算成本限制了这些方法的适用性。在对接技术中，对基于熵、脱溶效应和靶标特异性的评分函数进行了改进

增强抽样分子动力学方法和粗粒度分子动力学在药物设计

为了研究配体-受体复合物以及生物系统的动力学和热力学，分子动力学（MD）模拟是主要的计算资源之一，自70年代末引入以来[24,25]。MD程序计算一个分子系统在一段时间内的行为，提供蛋白质和核酸的波动和构象变化的大量数据[26]。目前，有几个用于执行MD模拟的程序可用。其中，ACEMD（加速有限公司，伦敦，英国），哈佛大学大分子力学（CHARMM）化学，辅助模型构建与能源精化（AMBER）（加利福尼亚大学，CA，旧金山），格罗宁根的化学模拟机（GROMACS），纳米尺度分子动力学（NAMD）（理论和计算生物物理学组，伊利诺伊大学在乌尔瓦纳厄本那香槟，IL）和德斯蒙德（D.E.肖研究，NY，NY），是最流行的。目前，有可能模拟复杂系统（全蛋白质）在含有显式溶剂、膜包埋蛋白质或大型大分子复合物（如核小体或核糖体）的溶液中[27-29]。后一种技术的改进，涉及所研究分子系统的大小以及所执行模拟的范围（即模拟的µs和/或ms）[30,31]这在很大程度上是由于使用了高性能计算、并行计算机体系结构和更高效的算法。MD模拟的改进还与开发更精确的力场有关，能够以详细的方式评估正在调查的系统，以便重新编程介绍该系统中每个粒子的性质[32,33]。最近的例子是CHARMM、AutoDock4的改进_锌液体模拟（OPLS）力场的优化潜力。这些进步主要涉及：（i）为本质上无序的肽和蛋白质（Charmm）产生多肽骨干构象合作组合的准确性[34];（ii）包含描述锌协调配体的相互作用的专业潜力，描述了交互的能量和几何分量（autodock4_锌)[35]；（iii）添加用于表示卤素键和芳基氮孤对的离原子电荷位点，并完全重新调整肽二面体参数，以更好地模拟蛋白质的天然结构（OPL）[36].在开发更精确力场方面的进展使得能够更精确地预测结合自由能。结合自由能在铅优化步骤中非常有用[37,38]。尽管MD模拟技术取得了进步，但时间计算方面的计算成本过高，这常常阻碍科学家运行足够数量的副本来评估方法的再现性。为了绕过传统MD模拟的时间尺度限制，开发了新的硬件资源。因此，MD模拟目前由图形处理单元（GPU）执行，提高了一个数量级的计算速度。此外，专门为这些MD模拟设计了新的处理器，构建了每天能够完成微秒模拟的超级计算机[39]。在现实时间内执行长时间模拟的愿望激发了各种增强采样实践的发展，利用约束加快系统的发展。例如，有几种方法，如元动力学[40]、加速MD[41]和粗粒度MD（CGMD）[42]在CGMD中，MD模拟的可访问时间尺度增加，系统的实际自由度通过将原子连接到聚合粒子而降低。AlthouGH这种技术已被证明是有用的研究生物分子系统，它被困扰的分辨率降低，因为不能成功捕捉微妙但相关的属性，如氢键系统在溶剂中。MD模拟可以灵活地处理蛋白质和配体，允许放松配体周围的结合位点考虑。更精确的基于MD的方法可用于估算结合自由能（热力学积分（TI）、线性相互作用能（LIE）、自由能微扰（FEP）和分子力学/泊松-玻尔兹曼表面积（MM/PBSA））.如上所述，使用MD模拟估算结合自由能的准确性可以提高药物发现过程的效率[43,44]。高通量分子动力学（HTMD）代表了MD技术的巨大改进，这是一种基于模拟吞吐量的新技术，允许以高分辨率和准确度了解药物与生物靶点的相互作用。该方法是大规模MD模拟，可用于筛选化学数据库。该方法在命中发现步骤中显示出比HTD更高的性能[45]。

结论

总而言之，硬件和软件资源、算法设计以及表征生物靶标的新实验程序开发方面的巨大技术进步，使计算机辅助方法(结合特定的生物学研究)成为限制临床前研究时间和成本的最有价值的方法。此外，CADD方法被用于减少动物的使用体内测试，帮助设计更有效和更安全的药物，并有助于重新定位已知药物。CADD是帮助药物化学家在药物发现过程中进行药物设计、发现、开发和命中优化的关键工具。

确认

作者希望感谢欧洲药物发现与开发研究中心(NatSynDrugs)的支持。我们也要感谢Giuseppe Campiani教授、Stefania Butini教授、Sandra Gemma教授和Margherita Brindisi博士在手稿撰写过程中所进行的富有成果的讨论。感谢英国抗菌化疗学会(BSAC)(授权编号GA2016_087R给SB)。

利益冲突

作者声明本论文的发表没有竞争性的经济利益。

参考

Choi S，Macalino SJ，Cui M，Basith S（2016）利用计算方法加速抗癌药物的设计、发现和开发。Curr-Med-Chem。[参考。]
Zaccagnini L，Brogi S，布林迪西男，吉马S，CHEMI G，等人。新的荧光探针的PrPSc防止复制在朊病毒病的（2016）鉴定。EUR医学杂志化学。[参考。]
Brogi S, Kladi M, Vagias C, Papazafiri P, Roussis V, et al.(2009)药效团模型用于定性预测抗雌激素活性。J Chem Inf模型49:2489-2497。[参考。]
Brogi S，Papazafiri P，Roussis v，Tafi A（2013）3D-QSAR使用基于药物的对齐和虚拟筛选来发现新型MCF-7细胞系抑制剂。EUR J Med Chem 67：344-351。[参考。]
加州大学旧金山分校(2016)锌^12.[参考。]
Patel P, Singh A, Patel V, Jain DK, Veerasamy R, et al.(2016)基于3D-QSAR的药效团，基于噻吩连接剂的新型HDAC抑制剂的虚拟筛选和对接研究。梳化学高通量筛19:735-751。[参考。]
Braga RC, Alves VM, Silva MFB, Muratov E, Fourches D，等。Mol Inform 34: 698-701。[参考。]
Brogi S，Corelli F，Di Marzo V，Ligresti A，Mugnani C等。（2011）三维定量结构选择性关系分析指导大麻素受体高选择性配体的合理设计2。欧洲医学杂志化学46:547-555[参考。]
关键词:CDK4抑制剂，噻吩[2,3-d]嘧啶-4-yl腙，3D-QSAR, 3D-QSSR药用植物学报35:151-160。[参考。]
Pasquini S，Mugnani C，Ligresti A，Tafi A，Brogi S等。（2012）吲哚-3-基乙酰胺，吲哚-3-基乙酰胺和吲哚-3-基甲酰胺的设计，合成和药理学特征：有效和选择性CB2大麻素受体反向激动剂。医学化学杂志55:5391-5402[参考。]
Speck-Planche A, Cordeiro MNDS(2015)多靶点QSAR方法建模蛋白抑制剂。同时预测革兰氏阴性菌生物大分子的活性。Curr Top Med Chem 15: 1801-1813。[参考。]
Yousefinejad S, Hemmateenejad B (2015) QSAR/QSPR研究中的化学计量学工具:历史视角。chemometer Intell实验室149:177-204。[参考。]
Brogi S, Giovani S, Brindisi M, Gemma S, Novellino E, et al. (2016)在网上与肽基 - 二氟替肽复合物中不同疟原虫种类的枯草杆菌蛋白酶样蛋白酶1（SUB1）研究及效率平移抑制剂的表征。J Mol图模型64：121-130。[参考。]
Abagyan R, Totrov M(2001)基于高通量对接的潜在客户。Curr Opin Chem Biol 5: 375-382。[参考。]
Brindisi M, Brogi S, Relitti N, Vallone A, Butini S, et al.(2015)基于结构的高通量连接发现第一个非共价利什曼原虫主要锥虫过氧化物酶抑制剂。Sci代表5:9705。[参考。]
甘尼申A，巴拉卡特K（2016）目标钓鱼：一键解锁药物discovery.J医药保健医疗Sys系统3一对多谜：E141。[参考。]
瑞士生物信息学研究所(2013)瑞士目标预测。[参考。]
罗南(2010)基于结构的目标垂钓和配体分析方法。Mol Inform 29: 176-187。[参考。]
wang CF(2015)药物发现的灵活受体对接。专家意见药物发现10:1189-1200。[参考。]
Sherman W, Day T, Jacobson MP, Friesner RA, Farid R(2006)模拟配体/受体诱导的拟合效应的新方法。J Med Chem 49: 534-553。[参考。]
吉马S，Camodeca C，Sanna的Coccone S，乔希BP，Bernetti M等人。（2012）的4-氨基喹啉/基于克霉唑混合抗疟药优化：另外构效关系，体内研究和初步毒性分析。J Med Chem 55：6948-6967。[参考。]
(2005)精确电荷在分子对接中的重要性:量子力学/分子力学(QM/MM)方法。化学学报26:915-931。[参考。]
(2010)有机和酶反应的量子和分子力学模拟进展。Acc Chem Res 43: 142-151。[参考。]
(2009)蛋白质折叠动力学。自然267:585 - 590。[参考。]
De Vivo M, Masetti M, Bottegoni G, Cavalli A(2016)分子动力学及其相关方法在药物发现中的作用。中华医学杂志59期:4035-4061。[参考。]
Mortier J, Rakers C, Bermudez M, Murgueitio MS, Riniker S, et al.(2015)分子动力学对药物设计的影响:配体-大分子配合物表征的应用。今日药物发现20:686 -702。[参考。]
Roccatano D, Barthel A, Zacharias M(2007)通过分子动力学模拟研究核小体核粒子在原子分辨率下的结构灵活性。生物聚合物85:407 - 421。[参考。]
Tinoco I，Wen JD（2009）单核糖体翻译的模拟和分析。Phys Biol 6:025006[参考。]
Brogi S，Butini S，Maramai S，科伦玻R，维尔加L，等人。（2014）疾病修饰抗阿尔茨海默病药：624-632：人类胆碱酯酶与β-淀粉样蛋白神经科学aggregation.CNS THER 20干扰的抑制剂。[参考。]
所罗门-费雷尔R，郭茨AW，普尔d，格兰德S，沃克RC（2013）与AMBER在GPU上例行微秒分子动力学模拟。2.显式溶剂粒子网Ewald的。Ĵ化学理论COMPUT 9：3878-3888。[参考。]
Gotz AW，Williamson MJ，Xu D，Poole D，Le Grand S等人。（2012）常规微秒分子动力学模拟琥珀色对GPUS。1.概括出生。J Chem理论计算8：1542-1555。[参考。]
Amisaki T，Toyoda S，Miyagawa H，Kitamura K（2003）的分子动力学硬件加速器的开发：一种计算板，计算与快速多极法协作的非粘合交互。J COPP CHEM 24：582-592。
(in 2016)第一性原理力场研究进展。中国科学(d辑:地球科学)[参考。]
Huang J, Rauscher S, Nawrocki G, Ran T, Feig M, et al. (2016) CHARMM36m:一种改进的折叠和内在无序蛋白质力场。Nat方法14:71-73。[参考。]
Santos-Martins D, Forli S, Ramos MJ, Olson AJ (2014) AutoDock4(Zn):用于小分子与锌金属蛋白对接的改进AutoDock力场。J Chem Inf模型54:2371-2379。[参考。]
(2016) OPLS3:一种提供广泛覆盖类药物小分子和蛋白质的力场。J化学理论计算12:281-296。[参考。]
Cappel D，Hall ML，Lenselink EB，Beuming T，Qi J，等。（2016）应用于蛋白质同源性模型的相对结合自由能计算。化学Inf模型杂志56:2388-2400[参考。]
Wang L, Wu Y, Deng Y, Kim B, Pierce L .， et al.(2015)通过自由能计算和力场精确可靠地预测未来药物发现中相对配体的结合能力。J Am Chem Soc 137: 2695-2703。[参考。]
Shaw DE, Deneroff MM, Dror RO, Kuskin JS, Larson RH, et al. (2008) Anton，一种用于分子动力学模拟的专用机器。Acm通信51:91-97。[参考。]
Ensing B, De Vivo M, Liu ZW, Moore P, Klein ML(2006)元动力学作为探索化学反应自由能景观的工具。Acc Chem Res 39: 73-81。[参考。]
Hamelberg D, Mongan J, McCammon JA(2004)加速分子动力学:一种有前途和有效的生物分子模拟方法。化学学报20:11919-11929。[参考。]
Sansom MSP，Scott KA，Bond PJ（2008）粗粒度模拟：膜蛋白的高通量计算方法。生物化学Soc Trans 36:27-32[参考。]
甘尼申A，库特ML，巴拉卡特K（2016）分子dynamicsdriven药物发现：有信心跨越式发展。药物发现今天。
赵H，Caflisch A（2015）药物设计中的分子动力学。EUR J Med Chem 91：4-14。[参考。]
Harvey MJ，De Fabritiis G（2012）《高通量分子动力学：药物发现的有力新工具》。今日药物发现杂志17:1059-1062[参考。]

在这里下载临时PDF

PDF

文章信息

文章类型:迷你回顾

引用:Chemi G，Brogi S（2017）药物发现计算方法的突破。药物研究发展杂志3（1）：doihttp://dx.doi.org/10.16966/2470-1009.129

出版历史：

收到日期:2016年11月23日

接受日期:2017年1月19日

发布日期：2017年1月25日

全文

德赢娱乐国际SCI Forschen期刊

新刊推荐