
图1所示。计算机辅助药物设计(CADD)流水线。
朱利亚化学西蒙Brogi*
欧洲药物发现与发展研究中心(Natsyndrugs)和生物技术,化学和药房系,锡耶纳大学,通过Aldo Moro 2,意大利53100锡耶纳*通讯作者:sione Brogi,欧洲药物发现和开发研究中心和生物技术、化学和制药系,锡耶纳大学,Via Aldo Moro 2, 53100锡耶纳,意大利,电话:+39-0577-234389;电子邮件:simonebrogi1976@hotmail.com; brogi32@unisi.it
在网上方法学已成为现代药物发现过程中的关键部分。自其诞生以来,计算技术已被证明可加速特定药物靶点的命中选择,并对药物发现的多个阶段(即药物优化)做出重大贡献[1]。因此,在网上药物设计和发现正处于不断快速发展的状态,这是由于:(i)计算机科学的进步导致了功能强大、价格合理的超级计算机的产生,可用在线工具、软件和数据库的扩散以及更可靠算法的发展;(ii)开发新的生物靶点表征实验程序(即X射线晶体学和核磁共振波谱);(三)提高对药物作用分子基础的认识。
在此,我们分析了最相关的计算机辅助药物设计(CADD)突破。将讨论在药物发现过程中具有不同潜在应用价值的各种计算方法(图1),并对其进行最后的改进在网上审查的工具和方法。
图1所示。计算机辅助药物设计(CADD)流水线。
药效建模,三维定量构效关系(3D-QSAR),比较分子场分析法(CoMFA)和比较分子相似性指数分析(指数分析)仍然基于配体(LB)的首选快速虚拟筛选方法(VS)程序。它们特别强大时所研究蛋白质的三维(3D)结构是未知的[2-4]。VS is routinely employed by academia and pharmaceutical companies to identify novel chemical entities using public (e.g. ZINC database [5]), commercial or proprietary 3D-databases, with the possibility to screen billion of compounds in a short time, in order to reduce drug discovery costs [6]. The large amounts of available positive information (i.e. biological and structural data) allow the use of large dataset of known characterized compounds also for the development of 3D-QSAR models. These are crucial information for relating the structural and/or physicochemical properties of compounds to their activities in order to obtain more robust statistical在网上预测新型化学实体[7]活性的模型。CoMFA和CoMSIA是生成3D- qsar模型的强大工具,可以将一组分子的生物活性与其三维形状、静电和氢键特性关联起来。这种关联是由一系列叠加构象推导而来的,每个分子对应一个构象。计算每个构象周围的分子场,得到的3D模型可用于VS协议,例如SYBYL-X Suite (Certara USA, Inc., Princeton, New Jersey, NJ)。
因此,在生成QSAR模型和使用公共可用数据库(考虑理论或实验数据)开发统计软件包方面的专业知识,使修正的结构-关系模型的实现成为可能。以下是一些重要的例子:
在过去的十年中,许多科学贡献出现在文献报告改进的QSAR方法。这些结构-关系模型的进展对于合理的药物设计和预测配体的不良效应是非常有用的hERG K+通道的亲和力。hERG K+信道是在由中枢活性药物靶向的公知的抗靶负责心脏毒性。事实上,用小分子的相互作用hERG K+频道是药物企业与药物开发过程有关的主要问题之一。近年来,由于相关活动,近年来,包括Astemizole,滴注醇,三丁胺,Lidolazine,Sertindole,CisaPride和氯丙嗪的销售药物hERG K+通道。在此背景下,生成一个充分的3D-QSAR模型基于hERG K+通道阻滞剂可以帮助合理设计新的潜在生物活性药物hERG K+通道的亲和力。
当已知配体复合物中靶点的三维结构信息时,基于结构的(SB)药物设计方法有助于推导SB药效团模型,包括排除体积(配体无法定位的三维空间部分)。生成SB药效团模型最常用的软件有:e-Pharmacophores,实现在Maestro套件(Schrödinger, LLC, New York, NY), LigandScout (Inte:Ligand GmbH,维也纳,奥地利),Catalyst,在Discovery Studio (Accelrys, Inc, San Diego, CA, USA)和SB药理学,在Molecular Operating Environment (MOE) (Chemical Computing Group’s (CCG), Montreal, QC, Canada)实施。其中,e-Pharmacophores方法通过生成能量优化的SB药效团,实现了配体和结构基础方法的优势,可用于快速筛选数十亿化合物。事实上,合成生物学模型被用于大规模化学数据库的筛选过程。正如关于LB方法的报道,实验过程的进展和最近CPU性能的改进,以及大型公共3d -化学库的可用性,都促进了这种计算方法的发展。有趣的是,SB药效团建模的相关进展表现为使用多个SB药效团模型,这些模型是利用与不同配体的复合物中感兴趣的蛋白质的可用晶体结构,在VS协议中建立的。SB模型可作为筛选化学库的顺序过滤工具。或者,它们可以结合在一个包含SB药效团模型中,考虑到配体与受体之间最相关的相互作用,从而生成一个综合SB药效团[13]。在这两种方法中,多种SB药效团模型可以用于VS或用于合理的配体设计,以识别新的化学实体或优化现有的靶点。 Likewise, LB and SB methods can be combined for obtaining more reliable hybrid computational protocols. Following this approach a performance increase in retrieving active molecules for a given target has been observed [2].
在分子对接技术方面,近年来在分子对接技术方面取得了重要进展在网上对接算法和评分功能可以生成受体-配体配合物的结构;它们可以对化合物进行排序,并可以使用特定的算法估计结合能/亲和力。因此,分子对接是最常用的工具,可以直接筛选大型化学数据库到选定的生物靶点的结合位点,可以应用于广泛的不同临床相关蛋白,从人、寄生虫、病毒或其他生物体。上述过程被定义为高吞吐量对接(High Throughput Docking, HTD),迄今为止可以应用于广泛的不同目标[14,15]。这多亏了计算能力、分子模拟算法、越来越多可用的实验3D蛋白质结构以及使用新型同源建模技术(即使用多个模板生成的模型)生成的稳健分子模型的最新进展。近年来,分子对接也被应用于识别和验证活性化合物的潜在靶点(目标垂钓)[16]。考虑到现有晶体结构的数量和表型筛选方法的优势,生物活性化合物对相关靶点的HTD,结合结合自由能的评价,可以帮助确定已知生物活性化合物的未知靶点。经典的对接程序,如Glide (Schrödinger, LLC, New York, NY), Autodock,配体对接遗传优化(GOLD)(剑桥晶体数据中心,Cambridge Crystallographic Data Centre, Cambridge, UK),可用于目标垂钓程序。此外,Maestro套件(Schrödinger, LLC, New York, NY)已经实现了一个自动化的程序,即虚拟筛选工作流(VSW),用于考虑不同的蛋白质进行多重对接,并结合所选配体的结合能量评估。此外,不同的在线工具可用于识别给定小分子的潜在靶标(如SwissTargetPrediction[17])。 These tools consider the similarity of the molecule without targets with compounds known to be active against specific ones. Despite the great improvement in amount and quality of data available in the Protein Data Bank (PDB), in terms of number of proteins, resolution of crystals, and in general in terms of reliability of the protein structures, several drawbacks for target fishing have been recently reported (i.e. improper pose predictions, scoring failures, binding site-ligand protonation interdependence, problems associated with generation of heterogeneous collection of binding cavities) [18]. Furthermore, modified molecular docking simulations aimed at improving the performance of standard molecular docking methods, continue to appear in the literature. A technique called “ensemble docking” was recently developed with the purpose of including protein flexibility in molecular docking calculation using multiple protein conformations. Consecutive docking calculations of each ligand into different conformations of a target receptor, represent a valuable method to mimic the dynamic nature of the biological target. In general, the performance of the “ensemble docking” technique is superior to that reported for docking into a single receptor conformation [19]. Another modified docking technique aimed at taking into account the protein flexibility is the Induced Fit Docking (IFD). This latter encompasses various steps such as ligands and proteins preparation and molecular docking, and induces conformational changes in the binding site to accommodate the ligand. In fact, this technique exhaustively identifies potential binding modes and related conformational changes by side-chain sampling, and backbone minimization in a selected radius around the poses found during the initial docking stage of the protocol [20]. Interestingly, a modified IFD protocol combining molecular docking with a rule-based approach to intrinsic reactivity has been developed for predicting potential sites of metabolism (soft spots) for a given ligand. This technique is useful for designing optimized derivatives which bear functionalities able to mask the identified soft spots. The IFD procedure calculates the accessibility degree of compounds to the cytochromes P450 (CYP) reactive center. The reactivity rules have been parametrized in P450 Site of Metabolism Prediction software (Schrödinger, LLC, New York, NY). The reactivity is predicted with a linear free energy approach based on the Hammett and Taft scheme, where the reactivity of a given atom is the sum of a baseline reactivity rate and a series of perturbations determined by the connectivity. This procedure is very useful for designing ligands with improved metabolic stability [21]. Further advances in docking calculations have been recently carried out by estimating从头开始用于改进对接预测的给定配体的电荷。量子力学极化配体对接(QPLD)工作流程,在Maestro套件(Schrödinger, LLC, New York, NY)[22]中实现,旨在通过替换由量子力学(QM)计算得到的电荷来改进分配给配体原子的部分电荷。采用量子与分子力学(Quantum and Molecular Mechanical, QM/MM)混合方法进行计算,其中蛋白质被认为是MM区域,配体被定义为QM区域。这样就考虑了受体对配体电荷的极化,并根据这些QM电荷进行配体的重新对接。QPLD代表了混合QM/MM评分方法的最新应用之一,该方法已迅速成为研究生物分子体系中化学反应活性的最流行的工具之一,允许对键形成和-破坏[23]进行建模。然而,执行高级QM计算的高计算成本限制了这些方法的适用性。在对接技术中,对基于熵、脱溶效应和靶标特异性的评分函数进行了改进
为了研究配体-受体复合物以及生物系统的动力学和热力学,分子动力学(MD)模拟是主要的计算资源之一,自70年代末引入以来[24,25]。MD程序计算一个分子系统在一段时间内的行为,提供蛋白质和核酸的波动和构象变化的大量数据[26]。目前,有几个用于执行MD模拟的程序可用。其中,ACEMD(加速有限公司,伦敦,英国),哈佛大学大分子力学(CHARMM)化学,辅助模型构建与能源精化(AMBER)(加利福尼亚大学,CA,旧金山),格罗宁根的化学模拟机(GROMACS),纳米尺度分子动力学(NAMD)(理论和计算生物物理学组,伊利诺伊大学在乌尔瓦纳厄本那香槟,IL)和德斯蒙德(D.E.肖研究,NY,NY),是最流行的。目前,有可能模拟复杂系统(全蛋白质)在含有显式溶剂、膜包埋蛋白质或大型大分子复合物(如核小体或核糖体)的溶液中[27-29]。后一种技术的改进,涉及所研究分子系统的大小以及所执行模拟的范围(即模拟的µs和/或ms)[30,31]这在很大程度上是由于使用了高性能计算、并行计算机体系结构和更高效的算法。MD模拟的改进还与开发更精确的力场有关,能够以详细的方式评估正在调查的系统,以便重新编程介绍该系统中每个粒子的性质[32,33]。最近的例子是CHARMM、AutoDock4的改进锌液体模拟(OPLS)力场的优化潜力。这些进步主要涉及:(i)为本质上无序的肽和蛋白质(Charmm)产生多肽骨干构象合作组合的准确性[34];(ii)包含描述锌协调配体的相互作用的专业潜力,描述了交互的能量和几何分量(autodock4锌)[35];(iii)添加用于表示卤素键和芳基氮孤对的离原子电荷位点,并完全重新调整肽二面体参数,以更好地模拟蛋白质的天然结构(OPL)[36].在开发更精确力场方面的进展使得能够更精确地预测结合自由能。结合自由能在铅优化步骤中非常有用[37,38]。尽管MD模拟技术取得了进步,但时间计算方面的计算成本过高,这常常阻碍科学家运行足够数量的副本来评估方法的再现性。为了绕过传统MD模拟的时间尺度限制,开发了新的硬件资源。因此,MD模拟目前由图形处理单元(GPU)执行,提高了一个数量级的计算速度。此外,专门为这些MD模拟设计了新的处理器,构建了每天能够完成微秒模拟的超级计算机[39]。在现实时间内执行长时间模拟的愿望激发了各种增强采样实践的发展,利用约束加快系统的发展。例如,有几种方法,如元动力学[40]、加速MD[41]和粗粒度MD(CGMD)[42]在CGMD中,MD模拟的可访问时间尺度增加,系统的实际自由度通过将原子连接到聚合粒子而降低。AlthouGH这种技术已被证明是有用的研究生物分子系统,它被困扰的分辨率降低,因为不能成功捕捉微妙但相关的属性,如氢键系统在溶剂中。MD模拟可以灵活地处理蛋白质和配体,允许放松配体周围的结合位点考虑。更精确的基于MD的方法可用于估算结合自由能(热力学积分(TI)、线性相互作用能(LIE)、自由能微扰(FEP)和分子力学/泊松-玻尔兹曼表面积(MM/PBSA)).如上所述,使用MD模拟估算结合自由能的准确性可以提高药物发现过程的效率[43,44]。高通量分子动力学(HTMD)代表了MD技术的巨大改进,这是一种基于模拟吞吐量的新技术,允许以高分辨率和准确度了解药物与生物靶点的相互作用。该方法是大规模MD模拟,可用于筛选化学数据库。该方法在命中发现步骤中显示出比HTD更高的性能[45]。
总而言之,硬件和软件资源、算法设计以及表征生物靶标的新实验程序开发方面的巨大技术进步,使计算机辅助方法(结合特定的生物学研究)成为限制临床前研究时间和成本的最有价值的方法。此外,CADD方法被用于减少动物的使用体内测试,帮助设计更有效和更安全的药物,并有助于重新定位已知药物。CADD是帮助药物化学家在药物发现过程中进行药物设计、发现、开发和命中优化的关键工具。
作者希望感谢欧洲药物发现与开发研究中心(NatSynDrugs)的支持。我们也要感谢Giuseppe Campiani教授、Stefania Butini教授、Sandra Gemma教授和Margherita Brindisi博士在手稿撰写过程中所进行的富有成果的讨论。感谢英国抗菌化疗学会(BSAC)(授权编号GA2016_087R给SB)。
作者声明本论文的发表没有竞争性的经济利益。
在这里下载临时PDF
文章类型:迷你回顾
引用:Chemi G,Brogi S(2017)药物发现计算方法的突破。药物研究发展杂志3(1):doihttp://dx.doi.org/10.16966/2470-1009.129
版权:©2017 Chemi G等。这是一篇开放获取的文章,在知识共享署名许可协议的条款下发布,该协议允许在任何媒体上无限制地使用、发布和复制,前提是注明原作者和来源。
出版历史:
所有SC德赢娱乐国际I Forschen期刊都是开放式访问权限