QSAR Models

簡介

Forge可以建立多種不同類型的定量與定性模型以進行構效關系(SAR)解釋以及活性預測。Forge的QSAR建模能力總結于下表。

QSAR models in Forge Quantitative model Qualitative model
3D Descriptor Field QSAR
Automatic Machine Learning
K-NN
Activity Atlas
Activity Miner
2D Descriptor k-NN Activity Miner

Field QSAR models

Cresset的Field QSAR方法用疊合過的分子形狀和靜電特征來建立描述活性的方程。與其他的方法不同,Field QSAR只用最小數量的基于不規則格點而不是規則格點的描述符,避免了與笛卡爾空間中分子取向相關的問題。完整的細節正在準備文章,如需詳細的方法請聯系我們。

Field QSAR模型提供了SAR數據的全局視圖。在SAR視圖平滑的地方工作得很好–分子中的小變化導致活性的小變化。在獲得穩健模型的情況下,可以用于預測新設計分子的活性,幫助確定合成的優先次序。除了預測之外,可以研究特定化合物與模型的擬合情況,以理解設計的有利或不利之處。這些反饋不僅可以用于改進設計,還有助于解釋模型和理解特定化合物高活性或非活性的原因。

AChE抑制劑QSAR模型

QSAR模型與化合物擬合

Figure 1. 上圖:AChE抑制劑的Field QSAR模型; 下圖:將一個活性分子與模型擬合以指導設計新化合物

自動機器學習(Automatic Machine Learning)

新版的Forge中引入了新的機器學習(ML)方法,包括支持向量機(Support Vector Machines, SVM)、關聯向量機(Relevance Vector Machines, RVM)和隨機森林(Random Forests, RF)。在新版Forge的Build Model選項框里不僅有之前的Field QSAR和kNN回歸(k-Nearest Neighbors regression),還增加了SVM、RVM與RF等機器學習方法(Figure 2)。有了這些眾所周知、健壯的統計工具,您可以更好地在項目工作中構建預測性模型。

Forge 10.6 機器學習

Figure 2. 新的機器學習方法顯著地擴展了Forge V10.6中QSAR模型構建選項的范圍

3D的靜電(基于Cresset XED力場)與形狀這兩個描述符跟分子之間的識別直接相關,因此非常適用于化合物的活性與選擇性的建模。Forge的Field QSAR以及新引入的機器學習方法正是使用這兩種描述符進行建模;而kNN除了可以使用3D靜電/形狀描述符外,還可以使用2D指紋做為描述符。

多種QSAR模型構建方法的重點是:您可以選擇在特定項目中性能表現最佳的方法/模型。如果你認為分別計算所有這些模型一定很無聊,那么我有一個好消息:你真的不會無聊。 Forge會默認自動運行所有ML模型并為您選擇最佳模型(Figure 3)。

Automatic QSAR Model

Figure 3. Forge自動構建所有可用的機器學習方法,并給出最佳模型

沒有高質量數據,但還想建立預測模型

有時,您擁有的數據并不像您希望的那樣干凈,不能用于QSAR建模的目的。 您可能有百分抑制率數據而不是pIC50或pKi; 數據來源于不同的測試實驗; 或者僅僅是定性的數據。

Forge中的機器學習方法可以用分級數據建立用于將化合物排序、分類為一種類別(比如活性/非活性,活性低/中/高)的分類模型。 Forge還將提供可視化工具(例如混淆矩陣,Figure 4)和分類性能指標(比如精確度,召回率,知情度)以評估模型的性能并確定它是否足以用于項目工作。

機器學習分類模型

Figure 4. 分類模型的混淆矩陣與其它統計學指標

k-Nearest Neighbor (k-NN) Models

kNN是一種健壯的、眾所周知的方法。當面與多個系列的化合物或者與來源于不同的生物學數據一起使用時特別有用。對于每個分子,它找到k個最相似的分子(鄰居)并且使用這些分子來預測所研究的分子的活性。傳統的k-NN模型使用2D相似性來測量到鄰居的距離。在Forge中,k-NN模型可以使用:

  • 3D相似性:Cresset場相似性、Gaussian形狀相似性、或靜電場與形狀組合的DD相似性。
  • 2D相似性:ECFP4, ECFP6, FCFP4以及FCFP6計算的指紋圖譜相似性

Activity Atlas

Activity Atlas用3D等值圖來總結系列化合物的構效關系,它采用貝葉斯來分析:

  • 活性化合物的平均形狀與靜電特征
  • 完整的活性懸崖矩陣
  • 已經探索到的形狀與靜電區域

Activity Atlas特別適合于數據不足以做出傳統3D-QSAR模型,但又需要了解SAR的情況;與機器學習方法是好搭檔:因為機器學習方法采用復雜的方程,不能輕易地轉換回3D配體-蛋白質相互作用的信息,而Activity Atlas可以非常方便的解釋SAR。

Field QSAR

Figure 5. 上圖:Field QSAR靜電場(左)和立體場(右)系數。 下圖:活動懸崖靜電場概要(左)和活動懸崖形狀場概要(右)。 顏色編碼:紅色=增加正靜電勢有利活性; 藍色=更多負靜電勢有利于活性; 綠色=有利的立體體積; 洋紅色=不利的立體沖突。

Activity Miner

Activity Miner用于發現和了解SAR中的活性懸崖。 它可以在2D和3D相似性上運行。 與Field QSAR和機器學習模型不同,它在SAR圖景特別鋸齒狀的地方很有效。 此處詳細描述了Activity Miner

相關鏈接

摇滚之夜怎么玩 蓉胜娱乐 竞彩计算器 北京pk精准在线计划全天 时时计划稳定版 时时彩后三包胆570 江西时时还有漏洞吗 福建时时走势图百度百度贴吧 巴恩斯 重庆时时开奖结果记录官 幸运28全包不去号能赚吗 天天特购 抢庄牌九app下载 欢乐二人雀神麻将下载 pc蛋蛋免费精准计划 精准 北京pk赛车专家杀一码 一分快三技巧大小玩法