OpenEye案例 | FreeForm改善MM/PBSA的結合自由能預測

昆蟲蛻皮激素受體虛擬篩選

原文:Horoiwa, S., Yokoi, T., Masumoto, S., Minami, S., Ishizuka, C., Kishikawa, H., … Miyagawa, H. (2019). Structure-based virtual screening for insect ecdysone receptor ligands using MM/PBSA. Bioorganic & Medicinal Chemistry, 27(6), 1065–1075. https://doi.org/10.1016/j.bmc.2019.02.011

前言

蛻皮激素受體(EcR)是一種昆蟲核受體,由蛻皮激素20-羥基蛻皮激素激活。 由于合成的EcR配體會破壞昆蟲的正常生長,因此它們是有吸引力的新型殺蟲劑候選物。 在本研究中,作者用MM/PBSA方法預測配體的EcR結合活性。 使用40個已知EcR配體的驗證研究表明,當引入配體的構象自由能項時,令人滿意地預測了結合活性。 隨后,將該MM/PBSA方法應用于基于結構的分級虛擬篩選,從380萬化合物的數據庫中挑出12個化合物,其中5個化合物在基于細胞的競爭性結合測試中具有活性。最有效的化合物是簡單的脯氨酸衍生物,具有低微摩爾結合活性,是有價值的先導化合物,有待進一步結構優化。

MM/PBSA方法的驗證

作者首先用了40個已知的EcR配體進行方法驗證研究:探討MM/PBSA能否有足夠的精度預測40個配體的活性。過程詳述如下:

驗證用配體數據集

13個化合物由合成而得,15個化合物由Mitsui Chemicals Agro公司友情贈送,12個化合物來自自家的庫存樣品,化合物的結構與活性見原文表1.

EcR的同源建模

e S. frugiperda EcR (SfEcR) 配體結合域(LBD)的3D結構用Modeller 9.16同源建模而得。SfEcR LBD一級序列用GenBank獲取號AAM55494與 CAD58232的兩段部分序列拼合而來。模板用了HvEcR LDB與ecdusterioid EcR晶體結構,PDB code分別為3IXP與1R1K。

分子對接

OpenEye的OEDocking 3.2.0.2軟件包用于分子對接計算。EcR結合位點的模型用MAKE_RECEPTOR模塊生成;化合物的構象系綜用OMEGA 2.5.1.4準備;分子對接用HYBRID進行計算。

分子動力學模擬與MM/PBSA計算的準備

AMBER 16軟件包用與分子動力學模擬(MD Simulation,MDS)研究以及MM/PBSA計算。AMBER 16的TLEAP模塊用來準備MDS的模擬體系。蛋白-配體復合物結構由上一步的分子對接而來。原子電荷用內置于antechamber模塊的AM1-BCC法計算而得,蛋白采用AMBER force field 14SB(ff14SB)力場,配體采用general AMBER force field 2(GAFF2)力場。體系用Na+與Cl離子進行電荷中和并包于由TIP3P水分子模型組成的10? 厚的立方體水盒子中。

分子動力學模擬

AMBER 16的pmemd.cuda模塊用來進行MDS計算,所有的體系都用了周期邊界條件。Particle mesh Ewald(PME)計算長程靜電相互作用截斷值為12.0?。MDS的時間步長(time step)設為1.0fs。共價連接的氫原子采用SHAKE算法進行了約束。在MDS之前,體系先進性最陡下降法與共軛梯度法進行能量最小化以獲得小于0.5 × 10?4kcal mol?1 ??2的梯度。然后將體系在恒容系綜里(NVT)逐步在20ps里用0.5kcal mol?1 ??2的約束從100K升溫至300K。然后在常壓系綜(NPT)中進行180ps的平衡。生產計算(Production run)在NPT系綜進行150ps模擬,蛋白-配體復合物坐標每1ps保存此意用于MM/PBSA計算用。對于每個配體分別進行3次不同初始速度的分子動力學模擬,最后每個配體總共得到450(150×3)幀快照。

MM/PBSA計算

蛋白-配體結合自由能(ΔGbind)可以表示Eq 1的三個態的自由能差值:

ΔGbind = GPL -GP – GL (1)

其中下標PL, P與L分別代表蛋白-配體復合物,Apo蛋白(不結合配體的蛋白)與游離的配體。在MM/PBSA中,每個態的自由能用Eq 2來評估:

ΔGX = EMM + GPB + GSA -TS (2)

其中下標X代表PL,P與L。在上述方程中,EMM是氣相中分子力學能量,為庫倫相互作用能、范德華相互作用能與鍵能的總和。GPB是溶劑化自由能的極性相互項,用PB(Poisson-Boltzmann)方程計算;GSA是溶劑化自由能的非極性項,用溶劑可及表面積來預估;TS是溶質的熵乘以絕對溫度。在本文中,僅配體的構象自由能被加以考慮(見下文)。復合物結構MDS軌跡作為Apo蛋白與游離配體的軌跡來源。MM/PBSA用AMBER 16的MMPBSA.py.MPI模塊來進行計算。內部與外部的介電常數分別設為1.0與80.0。

配體構象自由能計算

配體構象自由能(Ligand conformational free energy)用OpenEye SZYBKI 1.9.03的FreeForm模型進行計算。FreeForm內置了快速的構象熵計算方法。MM/PBSA用每化合物450幀的構象進行計算,為了減少計算量,配體的構象自由能用每化合物45幀構象進行計算。

結果

作者考察了三個MM/PBSA計算策略(A,B,C):

  • 策略A:Single-point MM/PBSA
  • 對復合物結構進行MM最小化獲得的單一結構進行MM/PBSA打分。

  • 策略B:MD-based MM/PBSA
  • 基于復合物結構MDS軌跡進行MM/PBSA打分。

  • 策略C:MD-based MM/PBSA + ΔGconf_ligand
  • 在策略B基礎上考慮了配體的構象自由能:MD-based MM/PBSA + ΔGconf_ligand

出于比較的目的,也考察了對接打分值與實驗值的關系。三種MM/PBSA預測結合自由能,分子對接打分值與實驗pIC50的關系如圖1所示。其中實線為回歸趨勢線,R值為Pearson相關性系數。

pIC50與計算的結合自由能間的關系

Figure 1. 實驗值pIC50與計算的結合自由能之間的關系:(A)single-point MM/PBSA;(B)MD-based MM/PBSA;(C)MD-based MM/PBSA+ΔGconf_ligand;(D)對接打分值(Chemgauss4 score)。其中實線為回歸趨勢線,R值為Pearson相關性系數。

如圖1 3B所示,MD-based MM/PBSA方法與實驗結合親和力之間的一致性很差(R2=0.18)。令人驚訝的是,這甚至比分子對接打分值與實驗值之間的相關性(R2=0.21)還差。然而,如圖1 2C所示,引入了配體構象自由能(ΔGconf_ligand)之后,顯著且巨大地提升了相關性(R2=0.56)。

不同方法預測方法與實驗值相關性系數的比較

值得注意的是,圖1 2C的回歸線與截距是相當合理的。盡管40個受試的配體具有結構上的相似性,但是它們構象自由能具有相當大的差別,分布范圍從0.44到6.9kcal/mol。ΔGconf_ligand項的巨大貢獻主要是因為有些配體在結合位點里被迫擺出的不合理的構象所致。以化合物7與35對接構象為例,它們有相似的骨架、在結合位點里擺出同樣的構象(Figure 2), 然而它們之間的ΔGconf_ligand差值達到了2.84 kcal/mol,這很好地解釋了為什么化合物7的活性是35的8500倍。

化合物7與35

Figure 2. 化合物7與35對接構象的比較

MM/PBSA的構象自由能經常采用游離配體的MDS軌跡用正則模分析(nomal mode analysis,MNA)計算而得。然而,NMA用于大規模虛擬篩選是個挑戰,主要是因為一方面收斂具有難度,另一方面計算費用非常昂貴。在本文中,FreeForm用來計算配體的構象自由能。在FreeForm中,構象自由能用OMEGA計算高辯構象系綜以及Wlodek等人開發的構象熵算法獲得。因此,FreeForm不會有收斂上的問題,并且可以大規模的進行計算,適用于虛擬篩選的場合。

小結

總的來說,MM/PBSA驗證結果表明不同策略的預測性能從高到低排序如下:MD-based MM/PBSA+ΔGconf_ligand, Single point MM/PBSA,docking scoring,MD-based MM/PBSA。計算效率排序如下:docking scoring, single point MM/PBSA, MD-based MM/PBSA, MD-based MM/PBSA + ΔGconf_ligand。因此,作者決定采用docking scoring, single point MM/PBSA, MD-based MM/PBSA + ΔGconf_ligand用于分級虛擬篩選。

基于結構的虛擬篩選

虛擬篩選流程如Figure 3所示,分級策略用于篩選含380萬化合物的數據庫。首先用FRED對接方法進行虛擬篩選,Chemgauss4為打分函數,保留5000個打分最高的化合物;接著,用single point MM/PBSA策略對5000個化合物進行打分,取打分值優于-10kcal/mol的化合物,最后得到打分最高的389個化合物;這389個化合物進一步用MD-based MM/PBSA + ΔGconf_ligand策略進行打分,選擇其中ΔGbind≤?9 kcal/mol的化合物并進一步依據結構新穎性與商業可購買性進行了人工挑選。最后12個在結構上與現有的EcR配體截然不同化合物從Namiki Shoji公司采購回來,并進行了活性測試。雖然虛擬篩選用的化合物是立體化學區分的,但是采購回來的化合物是立體化學混合物。

虛擬篩選流程

Figure 3. 虛擬篩選流程

12個化合物的純度均大于90%,放射性配體競爭實驗的生物活性測試結果見表1。盡管7個化合物在最高濃度(100或250ΜM)沒有表現出結合能力,但是其它的5個化合物(41,42,46,48,50)抑制了放射性配體的結合。最強效化合物42的IC50為9.1uM,大約比上市商品化合物Tebufenozide(化合物7)與Chromafenozide(12)活性弱5000倍。然而,因為化合物42是簡單的脯氨酸衍生物,因此它是一個值得進一步優化的起始化合物。

Table 1. 12個化合物的結構、計算的ΔG與實驗IC50

ID Structure ΔG pIC50 ID Structure ΔG pIC50
41
-9.13 4.28 47
-12.99 小于3.60
42
-9.49 5.04 48
-9.61 4.11
43
-14.01 小于3.06 49
-10.70 小于3.60
44
-9.57 小于4.00 50
-11.01 4.12
45
-9.44 小于4.00 51
-10.16 小于3.60
46
-10.73 4.13 52
-10.51 小于3.60

總結

在本研究中,作者將基于MD軌跡的MM/PBSA與FreeForm的構象自由能組合開發了EcR配體結合親和力預測的高效計算方法。該計算方法用于基于結構的分級虛擬篩選,成功地從380萬化合物數據庫中識別出5個全新的EcR配體(IC50小于100uM),命中率(42.7%)顯著地優于已有文獻報道的虛擬篩選方法,這說明該MM/PBSA方法的有效性。

本研究的亮點

  1. 開發了MD-based MM/PBSA + ΔGconf_ligand結合自由能預測策略;
  2. 用OpenEye/Fred分子對接進行第一輪的虛擬篩選過濾;
  3. 用單點MM/PBSA預測結合親和力,進行了第二輪的過濾;
  4. MD-based MM/PBSA與構象自由能組合,進行了第三輪過濾。

相關主題

FreeForm評估構象穩定性,設計大環分子

聯系我們,獲取試用

摇滚之夜怎么玩 通比牛牛口诀 中国足彩网手机版 抢庄牛牛技巧 彩票平台娱乐彩票 体球网即时比分手机版 国际金尊 北京pk10冠军技巧 河北时时计算公式 pk10赛车投注技巧 重庆时时存在作弊么 最新的pk10app下载 领航计划软件手机版下载 飞禽走兽玩法 正宗中国麻将 宝来娱乐 重庆时时全天计划单期