国产精品成人国产乱,精品一区二区三区无码免费视频,天天综天天爱,国产亚av手机在线观看,又爽又黄无遮挡高潮视频网站

北京同林科技有限公司

同林臭氧 · 臭氧發(fā)生器廠家專注臭氧20年

銷售熱線:010-82461830

當前位置: 主頁 > 知識與標準 > 臭氧知識 > 機器學習驅(qū)動的分子嵌入助力預測臭氧氧化去除新興污染物

機器學習驅(qū)動的分子嵌入助力預測臭氧氧化去除新興污染物

機器學習驅(qū)動的分子嵌入助力預測臭氧氧化去除新興污染物

摘要

機器學習驅(qū)動的分子嵌入助力預測臭氧氧化去除新興污染物在飲用水處理過程中,臭氧在去除新出現(xiàn)的污染物(ECs)方面具有很高的功效。然而,傳統(tǒng)的定量結(jié)構(gòu)激活關系(QS

更新時間:2025-06-16
來源:www.vanyah.cn
作者:同林科技
瀏覽:
關鍵詞: 臭氧氧化 去除新興污染物
詳細介紹相關案例

機器學習驅(qū)動的分子嵌入助力預測臭氧氧化去除新興污染物

在飲用水處理過程中,臭氧在去除新出現(xiàn)的污染物(ECs)方面具有很高的功效。然而,傳統(tǒng)的定量結(jié)構(gòu)激活關系(QSAR)模型往往不能有效地規(guī)范化和表征不同的分子結(jié)構(gòu),從而限制了其對各種ec去除的預測準確性。本研究使用由圖神經(jīng)網(wǎng)絡(GNN)生成的嵌入式分子結(jié)構(gòu)向量,結(jié)合功能群提示,作為前饋神經(jīng)網(wǎng)絡的輸入。建立了28個ec和542個數(shù)據(jù)點的數(shù)據(jù)集,代表了不同的分子結(jié)構(gòu)和物理化學性質(zhì),以預測ec (REC)在臭氧氧化中的殘留率。與傳統(tǒng)的QSAR模型相比,基于gnn的分子結(jié)構(gòu)嵌入方法顯著提高了預測精度。由此產(chǎn)生的KANO-EC模型REC的R2為0.97,證明了其捕獲復雜結(jié)構(gòu)特征的能力。此外,KANO-EC保持了出色的可解釋性,闡明了參與氧化機制的關鍵官能團(如羰基、羥基、芳香環(huán)和胺)。本研究提出了KANO-EC模型作為預測電流和電位ec的臭氧氧化去除效率的新方法。該模型還為制定有效的控制戰(zhàn)略以確保飲用水供應的長期安全和可持續(xù)性提供了寶貴的見解。


主要研究發(fā)現(xiàn)

本研究引入GNN生成的分子結(jié)構(gòu)嵌入向量,并結(jié)合功能團提示,作為前饋神經(jīng)網(wǎng)絡的輸入?;?8種ECs和542組實驗數(shù)據(jù),構(gòu)建了涵蓋多種分子結(jié)構(gòu)與理化性質(zhì)的數(shù)據(jù)集,用于預測臭氧氧化后的REC。與傳統(tǒng)QSAR模型相比,GNN嵌入方法顯著提升了預測準確性。所構(gòu)建的KANO–EC模型在REC預測中實現(xiàn)了R2值高達0.97,展現(xiàn)出對復雜結(jié)構(gòu)特征的精準捕捉能力。同時,該模型保持了良好的可解釋性,成功識別出羰基、羥基、芳環(huán)、胺等關鍵功能團在臭氧反應機制中的作用。本研究提出的KANO–EC模型為評估現(xiàn)有及潛在ECs的臭氧去除效率提供了新方法,并為保障飲用水系統(tǒng)的長期安全與可持續(xù)運行提供了理論支持。

本研究探索了四種分子結(jié)構(gòu)嵌入路徑對模型性能與泛化能力的影響(圖1)。首先采用ECFP提取基于環(huán)狀拓撲的結(jié)構(gòu)指紋,生成1024位分子指紋表征分子活性特征(圖1a)。其次,采用SMILES對編碼(SMILES Pair Encoding,SPE)方法構(gòu)建SMILES子串詞匯表并編碼為向量,適用于QSAR建模但可解釋性較弱(圖1b)。D-MPNN利用定向邊傳播機制更新原子與鍵的特征信息,生成嵌入向量以捕捉局部結(jié)構(gòu)環(huán)境(圖1c)。KANO模型則基于知識圖譜識別功能團語義,通過注意機制生成功能提示并融合至原子表示中,提升結(jié)構(gòu)表達與預測性能(圖1d)。

20250616001.jpg

圖1 利用(a) ECFP (b) SPE-MLP (c)D-MPNN和(d) KANO對分子結(jié)構(gòu)嵌入途徑進行比較可視化


本研究對ECs濃度特征(圖2a)、水體理化性質(zhì)(圖2b)及臭氧處理條件(圖2c)進行了統(tǒng)計分析。原水中ECs濃度變化范圍大,處理后普遍降低。REC值分布均勻,部分超過1,可能源于臭氧反應遲緩或檢測誤差。為模擬真實飲用水環(huán)境,實驗調(diào)控水質(zhì)與處理條件,使其貼近常規(guī)工況。通過t-SNE算法降維分析,高維特征得以保留本征結(jié)構(gòu)。圖2d顯示,喹諾酮、農(nóng)藥和PFAS聚類緊密,表現(xiàn)出類似特性與臭氧響應;而抗生素與藥品分布較散,差異顯著。進一步分析表明,PFAS與農(nóng)藥響應性差,REC偏高;喹諾酮類等則展現(xiàn)出良好反應性,驗證機器學習在復雜結(jié)構(gòu)預測中的有效性。

20250616002.jpg

圖2 新興污染物數(shù)據(jù)特征分布與t-SNE聚類揭示模型代表性


對比分析顯示,四種模型在驗證集上均具備較高預測能力,DMPNN–EC表現(xiàn)最佳(R2=0.9717),KANO–EC次之,SPE–MLP–EC亦優(yōu)于ECFP–EC(圖3a–d)。在結(jié)構(gòu)平衡劃分測試集上,模型性能普遍下降(圖3e),尤以SPE–MLP–EC退化最顯著,因SMILES分詞器難以處理新結(jié)構(gòu)中的未知符號。ECFP–EC因指紋固定,難泛化新結(jié)構(gòu)。相比之下,DMPNN–EC與KANO–EC依托圖結(jié)構(gòu)建模,可有效捕捉復雜結(jié)構(gòu)特征,展現(xiàn)出較強的泛化能力,適用于多樣性更高的環(huán)境污染物預測任務。

20250616003.jpg

圖 3 四種分子嵌入模型在隨機與結(jié)構(gòu)平衡數(shù)據(jù)集上的REC預測性能對比


為評估特征對模型預測能力的影響,研究對四種前饋神經(jīng)網(wǎng)絡(FNN)模型逐一剔除各類輸入變量并比較R2變化(圖4a)。結(jié)果顯示,去除SMILES變量導致R2下降最顯著,表明分子結(jié)構(gòu)信息對REC預測至關重要。臭氧反應時間、UV254、臭氧濃度與溫度的缺失也顯著降低模型性能,說明這些環(huán)境因子在臭氧氧化中同樣關鍵。相比之下,初始濃度(Cinitial)與pH對預測影響不顯著,因?qū)嶋H水體pH波動較小。進一步計算模型平均R2差異,明確各變量的重要性排序為:SMILES > 時間 > UV254 > 臭氧 > 溫度 > Cinitial > pH(圖4b)。

20260516004.jpg

圖 4 特征剔除下模型性能變化揭示多因素對REC預測的重要性排序

為識別對REC預測貢獻最大的關鍵結(jié)構(gòu),圖5展示了五類ECs代表分子的功能團注意力權(quán)重可視化。喹諾酮類的恩諾沙星中,羰基權(quán)重最高,其次為羥基、苯環(huán)和氟原子,符合Fukui函數(shù)分析所揭示的主要臭氧攻擊位點(圖5a)。除喹諾酮外,農(nóng)藥阿特拉津的三嗪環(huán)較穩(wěn)定,甲基雖非活性位點,卻表現(xiàn)出負向反饋(圖5b)??股鼗前范奏奏わ@示苯環(huán)、伯胺和磺胺基為關鍵結(jié)構(gòu),匹配其藥理骨架(圖5c)。PFAS代表物PFNA因C–F鍵極強,幾乎不被臭氧氧化降解(圖5d)。藥物卡馬西平中,C=C雙鍵為最主要反應位點,輔以苯環(huán)與羰基(圖5e)。KANO–EC模型準確捕捉了功能團的結(jié)構(gòu)–活性關聯(lián),為反應機制解析提供結(jié)構(gòu)依據(jù)。

20250616005.jpg

圖 5  不同類別污染物中關鍵功能團的注意力權(quán)重可視化分析


 圖6聚焦于大環(huán)內(nèi)酯類抗生素的結(jié)構(gòu)-反應特征,涵蓋克拉霉素(CLR)、紅霉素(ETM)與替樂菌素(TLS)。結(jié)果顯示,TLS具有更高的表觀反應速率常數(shù)(圖6a),主要因其C=C雙鍵與醛基獲得更高注意力權(quán)重(圖6b)。三者均含羰基、酯、醚、叔胺和羥基等共通功能團。密度泛函理論計算表明,CLR中第5位氧原子與第7位碳原子具有顯著的自由基Fukui函數(shù),均屬于羰基結(jié)構(gòu)(圖6c,d)。結(jié)合模型注意力權(quán)重,羰基被識別為主要反應位點。當缺乏顯著親電基團(如C=C或醛基)時,羥基自由基成為進攻羰基的主要反應機制。

20250616006.jpg

圖 6  大環(huán)內(nèi)酯類抗生素臭氧反應速率與關鍵結(jié)構(gòu)位點的建模識別


主要結(jié)論本研究構(gòu)建的融合分子結(jié)構(gòu)嵌入的機器學習框架在預測新興污染物殘留率方面取得了顯著成果,為大數(shù)據(jù)條件下的水處理智能控制及環(huán)境風險評估提供了新路徑。該模型核心算法具備良好遷移性,可拓展應用于混凝、沉淀、活性炭吸附、消毒等多種水處理單元過程。通過將各處理環(huán)節(jié)模塊化并集成為統(tǒng)一體系,可實現(xiàn)全過程優(yōu)化控制,提升ECs在多階段處理過程中的協(xié)同去除效率,為構(gòu)建智能化、高效能的水處理系統(tǒng)奠定技術(shù)基礎。

摘自:Machine Learning-Assisted Molecular Structure Embedding for Accurate Prediction of Emerging Contaminant Removal by Ozonation Oxidation

第一作者:Jiapeng Yue通訊作者:胡承志通訊單位:中國科學院生態(tài)環(huán)境研究中心、中國科學院大學原文鏈接:https://pubs.acs.org/doi/10.1021/acs.est.4c14193


国产精品成人国产乱,精品一区二区三区无码免费视频,天天综天天爱,国产亚av手机在线观看,又爽又黄无遮挡高潮视频网站