分會
第五十四分會:物理有機化學
摘要
金屬卟啉作為仿生催化劑的研究已有120多年的歷史,至今為止已經(jīng)積累了大量的數(shù)據(jù),這為深度學習發(fā)現(xiàn)潛在化學規(guī)律和結(jié)構(gòu)功能關(guān)系提供了堅實的基礎(chǔ)。本研究系統(tǒng)研究了金屬卟啉深度學習的關(guān)鍵組成部分,包括數(shù)據(jù)庫、分子表示和模型架構(gòu)。提出了一種構(gòu)建金屬卟啉規(guī)范SMILES表示方式的方案,并用于在現(xiàn)有的計算數(shù)據(jù)庫中表示超過10,000種金屬卟啉的二維結(jié)構(gòu)。之后,使用幾種最先進的化學深度學習模型,包括基于圖神經(jīng)網(wǎng)絡(luò)的模型和基于自然語言處理的模型,被用于預測金屬卟啉的能隙。其中定向消息傳遞神經(jīng)網(wǎng)絡(luò)(D-MPNN)模型和BERT模型都顯示了令人滿意的預測性能(R2 > 0.94),且僅將金屬卟啉規(guī)范SMILES表示方式作為唯一的結(jié)構(gòu)信息來源。此外,利用無監(jiān)督可視化算法解釋深度學習模型學習到的分子特征。
關(guān)鍵詞
金屬卟啉;數(shù)據(jù)庫;分子表示;深度學習;分子性質(zhì)預測
線上墻報僅限年會已繳費參會代表觀看。
您還沒有登錄,請您先 點擊這里登錄

