99精品国产综合久久久久久欧美_国产+亚洲+制服_少妇2做爰伦理_少妇搡bbbb搡bbb搡野外_公交车上双乳被老汉揉搓玩_日韩中文字幕区一区有砖一区_无码又爽又刺激a片涩涩动漫_国产素人自拍亚洲国产观看公司首页_丁香桃色网

浙大團隊將化學知識引入機器學習,提出可外推、可解釋的分子圖模型預測反應性能

2025-05-18 點擊數(shù):0 分享至:


化學反應的預測建模在藥物發(fā)現(xiàn)、材料科學等領域至關重要。然而,化學轉(zhuǎn)化的復雜性與多樣性,使得構建兼具強外推能力和化學可解釋性的合成轉(zhuǎn)化預測模型頗具挑戰(zhàn)。

圖片

為彌合豐富的化學領域知識與先進分子圖模型間的鴻溝,浙江大學洪鑫課題組提出了基于知識的分子圖模型SEMG-MIGNN,該模型嵌入了數(shù)字化空間和電子信息。同時,研究團隊開發(fā)了分子相互作用模塊,以解析反應組分的協(xié)同影響。

實驗表明,這種基于知識的圖模型可精準預測反應產(chǎn)率和空間選擇性,且外推能力經(jīng)實驗驗證。得益于局部環(huán)境嵌入,模型能從原子層面闡釋空間和電子效應對整體合成性能的影響,為分子工程實現(xiàn)目標合成功能提供了有力指導,也為反應性能預測提供了兼具外推性與可解釋性的新方法,凸顯了化學知識約束反應建模在合成領域的重要性。

圖片

對化學反應性和選擇性的深入理解與準確預測,是合理高效探索大規(guī)模合成空間的基礎。結(jié)構-性能關系(SPR)的構建主要圍繞反應機理研究和決定性過渡態(tài)模型闡釋展開。借助過渡態(tài)模型,化學家可剖析反應性/選擇性趨勢的根源,并基于化學理論與經(jīng)驗作出合成判斷。但在缺乏明確機理基礎和解析方程的情況下,處理高維SPR仍是難題。

數(shù)據(jù)驅(qū)動方法近年來成為構建SPR的有力策略?,F(xiàn)代機器學習(ML)算法通過挖掘合成數(shù)據(jù)中的關聯(lián),可為合成預測構建強大模型。然而,人工合成轉(zhuǎn)化的機器學習預測與設計仍不成熟,主要瓶頸之一是適用于SPR預測的分子編碼方法和ML框架不足。

除人工指定的分子編碼工程外,化學預測領域?qū)Ρ碚鲗W習的關注與日俱增。隨著表征學習的創(chuàng)新與應用,數(shù)據(jù)驅(qū)動的分子性質(zhì)和反應性能預測取得顯著進展。在SPR預測方面,MIT的Coley團隊將經(jīng)典圖神經(jīng)網(wǎng)絡(GNN)模型與選定反應位點的量子化學描述符結(jié)合,開發(fā)了QM-GNN融合模型。該模型將位點特異性電子信息嵌入ML建模,提升了對一系列轉(zhuǎn)化的區(qū)域選擇性和反應性的預測能力,其成功表明增強局部化學信息表達可為合成建模提供有價值的支持。

受QM-GNN啟發(fā),研究人員推測,通過豐富化學環(huán)境的局部編碼并加強反應組分間的信息交互,可進一步優(yōu)化SPR預測。

圖片
圖 1:合成性能和分子特性的機器學習預測。
在此,研究人員開發(fā)了一種名為「基于分子相互作用圖神經(jīng)網(wǎng)絡的空間和電子嵌入分子圖」(Sterics-and Electronics-embedded Molecular Graph with Molecular Interaction Graph Neural Network,SEMG-MIGNN)的基于化學知識的 ML 模型,用于預測合成性能。SEMG-MIGNN 有兩個主要創(chuàng)新設計:首先,空間和電子效應的局部化學環(huán)境被數(shù)字化并嵌入到圖表示中。這顯著豐富了模型對原子環(huán)境的表征,并提高了模型對新分子結(jié)構的外推能力。此外,分子相互作用模塊可以有效地學習多個反應組分的協(xié)同控制,從而使分子建模有效地擴展到 SPR 建模領域。
具體而言,該研究引入了一種稱為空間和電子嵌入分子圖(SEMG)的分子圖模型,該模型結(jié)合了外部化學知識,以提高模型對局部化學環(huán)境的區(qū)分能力。該知識增強分子圖的設計的關鍵是在節(jié)點中嵌入空間和電子環(huán)境的原子信息。圖 2 以 1- 氯 -4-(三氟甲基)苯為例,展示了設計的分子圖模型的生成工作流程。
圖片
圖 2:SEMG 的生成工作流程。
基于SEMG豐富的化學信息,研究人員對GNN框架進行改進以適配SPR預測,尤其開發(fā)了分子相互作用模塊以增強反應組分間的信息交換。與超圖不同,分子相互作用GNN(MIGNN)依賴矩陣運算實現(xiàn)信息交換。
圖片
圖 3:分子相互作用圖神經(jīng)網(wǎng)絡(MIGNN)的框架和相互作用模塊的設計。
MIGNN 的交互模塊為 ML 模型提供了捕捉反應組分協(xié)同效應的機會,這對傳統(tǒng)的 SPR 預測 ML 框架具有挑戰(zhàn)性。在 MIGNN 中,相互作用矩陣允許具有物理意義的反應組分的所有可能組合充分交換它們的編碼信息,從而支持模型在反應組分交織的高維合成空間中的預測。
在 Pd 催化的 C-N 交叉偶聯(lián)反應的產(chǎn)率預測和手性磷酸(CPA)催化的硫醇加成 N- 酰基亞胺的對映選擇性預測中發(fā)現(xiàn)了很好的預測。對額外的 CPA 催化劑的進一步實驗測試證實了該模型在新催化劑預測中的外推能力。特別是,研究發(fā)現(xiàn) SEMG-MIGNN 模型在基于支架的拆分任務中表現(xiàn)出卓越的外推能力,考慮到需要擴展可用 SPR 數(shù)據(jù)的領域,這對于合成預測來說是非??扇〉?。
圖片
圖 4:SEMG-MIGNN 模型(空間和電子嵌入分子圖與分子相互作用圖神經(jīng)網(wǎng)絡)預測反應產(chǎn)率。(來源:論文)
圖片
圖 5:SEMG-MIGNN 模型預測對映體選擇性。(來源:論文)
除了出色的預測能力外,空間和電子效應的物理意義編碼還提供了原子級的化學解釋。對訓練模型的分析表明,電子效應對 C-N 交叉偶聯(lián)的產(chǎn)率預測起著至關重要的作用,而對映體選擇性預測則嚴重依賴于空間效應。
此外,該模型能夠識別分子結(jié)構的熱點,用于確定合成性能,為未來的設計提供有用的見解。該模型的有效性表明,將表示學習與數(shù)字化化學知識相結(jié)合可以支持化學空間中可泛化模型的開發(fā),為數(shù)據(jù)驅(qū)動的合成轉(zhuǎn)換設計提供機會。

研錦生物可以利用基于靶點或小分子結(jié)構的藥物設計方法,對可購買化合物、天然產(chǎn)物等數(shù)據(jù)庫進行虛擬篩選,并獲得潛在活性的化合物列表供進一步活性實驗確證。面向制藥企業(yè)和科研院所,可提供一站式的早期藥物研發(fā)服務,包括虛擬藥物篩選、先導優(yōu)化、靶標預測、 動力學模擬等,涉及小分子化學藥、生物藥、中藥等多種新藥類型,為您提供優(yōu)質(zhì)的藥物發(fā)現(xiàn)服務


圖片
 聯(lián)系我們 
技術交流 | 業(yè)務咨詢
郵件:[email protected]
電話 | 微信:15337192895 (張老師)

Yangenebio對于中藥及小分子藥物研究,建立了一套完整的技術服務體系:


武漢研錦生物科技有限公司(YanGeneBio)提供產(chǎn)品:


1,天然產(chǎn)物、中藥、代謝物等化合物靶點發(fā)現(xiàn)及SPR親和力驗證解決方案:

1)中藥/復方的有效成分高精度鑒定,網(wǎng)絡藥理學分析及SPR驗證互作;

2)化合物釣靶(標記法):ABPP釣靶(特異性強,重復性高,細胞水平釣靶);

3)化合物釣靶(非標記法):Lip-MS/CETSA(細胞、組織裂解液水平釣靶);

4)SPR/MST/BLI/ITC/DSF等策略檢測分子間親和力;

5)藥﹣靶結(jié)合位點分析(Lip-MS+分子對接鑒定純蛋白與化合物互作位點);

6)蛋白-蛋白結(jié)合位點分析(交聯(lián)質(zhì)譜+分子對接鑒定2個純蛋白間互作位點);

7)ABPP-WB/CETSA-WB 在細胞水平鑒定藥物與靶點蛋白互作分析;

8)提供真核、原核蛋白表達純化服務;

9)提供定制化基因敲除細胞模型驗證藥物活性;

10)基于分子對接等策略提供化合物高通量虛擬篩選技術服務;

11)提供蛋白、抗體芯片篩選服務:磷酸化抗體芯片,炎癥因子蛋白芯片等檢測服務;

12)提供Olink多因子蛋白組學檢測服務。


2,提供重組活性細胞因子產(chǎn)品:應用類器官培養(yǎng)、完全培養(yǎng)基添加劑、干細胞培養(yǎng)、細胞治療等領域。

3,提供分子互作儀、細胞電轉(zhuǎn)儀、蛋白純化儀、核酸合成儀及純化儀等設備。


圖片