【資料圖】
中國科學院遺傳與發育生物學研究所高彩霞研究組創新性地運用AI輔助的大規模蛋白結構預測,建立起全新的基于三級結構的高通量蛋白聚類方法,實現了脫氨酶功能結構的深入挖掘,鑒定到完全區別于已知脫氨工具酶的全新底盤元件,并成功開發了一系列具有我國自主知識產權的新型堿基編輯工具。該項工作為蛋白功能分析、新功能元件挖掘提供了全新策略。新研發的堿基編輯系統是具有我國自主知識產權的精準基因編輯技術,有望打破堿基編輯底層專利壟斷,將幫助我國在未來的生物技術產業競爭中處于有利地位。研究成果于2023年6月27日23點在線發表在Cell(細胞)雜志。
圖:基于AI輔助的蛋白結構聚類挖掘脫氨酶并開發具有新特性的堿基編輯系統。
蛋白質是生命活動的主要承擔者。堿基編輯系統可以實現單核苷酸精度的DNA或RNA精準編輯,是基因功能研究、疾病治療、生物育種的變革性技術。然而,現有堿基編輯系統的核心元件脫氨酶來源于單一家族,導致堿基編輯仍有諸多局限,編輯尚難以滿足多元化的應用需求。而且,現有堿基編輯系統的底層專利由國外持有,我國亟需擁有具自主知識產權的堿基編輯系統。因此,創新地挖掘新型脫氨酶,開發適用于不同應用場景的新型堿基編輯工具顯得尤為重要。
研究人員首先通過蛋白質結構預測模型AlphaFold2對具有代表性的脫氨功能序列進行批量三維結構預測,隨后創新性地開展了基于三維結構的蛋白質多重比對與聚類,成功將潛在的脫氨酶劃分為20個不同的分支。除已報道的APOBEC/AID胞嘧啶脫氨酶外,研究人員又檢測到了5個結構、序列全新的具有活性的胞嘧啶脫氨酶分支。在這些分支中,研究人員對具有類DddA脫氨結構域的蛋白進行進一步結構聚類和功能驗證,發現除以前推測的具有雙鏈DNA脫氨活性的蛋白外,該分支還包含了大量只具有單鏈DNA脫氨活性的蛋白,該結果顛覆了之前對該類蛋白功能的認知。以上研究表明,當蛋白集合的序列同源性較低且功能多樣時,相比于傳統的基于氨基酸一級序列的聚類方法,通過AI輔助的蛋白質結構聚類能夠得到更準確的結果。因此,該方法為蛋白質功能分析和挖掘提供了一個高效、可靠的新策略。
研究人員基于上述進一步聚類的結果,全新鑒定到45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd),開發了一系列新型堿基編輯系統,并在動、植物細胞中進行了測試。
結果表明,新開發的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統克服了常規編輯器對GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統展現出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統則展現出了極高的特異性,幾乎檢測不到脫靶事件。
研究人員進一步通過蛋白理性設計和功能驗證,開發了新型的可被單個腺相關病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細胞系中成功獲得高達43.1%的編輯效率, 解決了常規堿基編輯器過大而無法被腺病毒顆包被遞送的難題。
針對大豆中長期存在堿基編輯效率低下問題,研究團隊新開發了Sdd7-CBE系統,在154株大豆陽性苗中獲得了34株穩定編輯的植株,編輯效率高達22.1%。
研究突破了現有脫氨酶的應用瓶頸,展現出新型堿基編輯系統在醫學和農業方面廣泛的應用前景。
遺傳發育所高彩霞研究組博士后黃佳穎、林秋鵬,博士生費宏源、賀子欣為本文的共同第一作者;高彩霞研究員與北京齊禾生科生物科技有限公司的Kevin Tianmeng Zhao博士為本文共同通訊作者;青島華大基因的羅永倫教授團隊、中國農業科學院深圳農業基因組研究所左二偉研究員、中國科學院微生物研究所的邱金龍研究員參與了該研究。該研究得到了國家自然科學基金、國家重點研發計劃項目、中國科學院戰略性先導專項等項目的資助。(經濟日報記者 佘惠敏)
關鍵詞: