新疆理化所在RNA N6-甲基腺苷修飾位點識別方面取得進展
N6-甲基腺苷(N6-methyladenosine,?m6A)是最常見的RNA修飾之一,是一種關鍵的表觀遺傳因子信號,對剪接調節、mRNA穩定性、翻譯效率和表觀遺傳調控有著深遠的影響。盡管已經開發了各種計算模型來準確識別潛在的m6A修飾位點,但大多缺乏通過共識知識來解釋修飾位點識別過程的能力。
為了克服這一問題,中國科學院新疆理化技術研究所科研團隊提出了一種深度學習模型,即M6A-DCR,發現RNA序列上的共識區域以促進m6A修飾位點的可解釋識別。M6A-DCR首先通過整合核苷酸的特定位置和類型來構建每個RNA序列的實例圖,并將共識區域的發現轉換為聚集所有實例圖的圖聚類問題。之后,進一步采用基序感知的圖重構優化過程,學習輸入RNA序列的高質量嵌入,從而實現m6A修飾位點的端到端識別。通過與幾種最先進的識別模型進行比較,實驗結果證明了所提出的方法的優越性能。通過不同物種、不同組織的交叉驗證分析,進一步驗證了M6A-DCR鑒定結果與物種間進化關系的一致性以及相關效應蛋白與所發現共識區域的潛在關聯(圖1)。這表明考慮共識區域使該模型能夠在基序水平上做出可解釋的識別。
圖1. 效應蛋白與識別的共識區域對接細節
該研究為RNA m6A修飾位點的計算鑒定提供了有價值的見解。相關研究成果以《Discovering consensus regions for interpretable identification of RNA N6-methyladenosine modification sites via graph contrastive clustering》為題發表在生物信息領域國際頂級期刊IEEE Journal of Biomedical and Health Informatics (Volume: 28,?Issue: 4,?Pages: 2362 - 2372,?April 2024),并被選為封面文章(圖2)。
該研究工作得到了國家自然科學基金、新疆維吾爾自治區自然科學基金、中國科學院率先行動百人計劃以及CAS西部之光-西部交叉團隊項目的資助。新疆理化所為唯一完成單位,胡倫研究員為通訊作者,2022級博士李國棟為第一作者。IEEE Journal of Biomedical and Health Informatics是中科院1區TOP期刊,最新影響因子為7.7。
文章鏈接:https://ieeexplore.ieee.org/document/10413556
圖2. 文章封面