科學家開發(fā)新的適體生成計算模型,應用廣泛
來自日本的研究人員近開發(fā)了 RaptGen,這是一種重要的計算模型,可用于新的適體生成
適體是通過指數(shù)富集 (SELEX) 系統(tǒng)進化配體產(chǎn)生的單鏈寡核苷酸。它們具有廣泛的應用,但計算方法對于有效識別候選適體是必要的。來自日本的一組研究人員現(xiàn)已開發(fā)出 RaptGen,這是一種變分自動編碼器,可有效發(fā)現(xiàn)輸入 SELEX 數(shù)據(jù)集中未包含的新適配體。這種新穎的計算模型有朝一日可能成為適體生成的標準方法。
寡核苷酸是合成 DNA 或 RNA 的短單鏈。盡管很小,但這些分子在分子和合成生物學應用中發(fā)揮著重要作用。一種寡核苷酸——適體——可以選擇性地與特定靶標結(jié)合,例如蛋白質(zhì)、肽、碳水化合物、病毒、毒素、金屬離子甚至活細胞。由于它們與抗體相似,它們在生物傳感器、和診斷領域具有多種用途。然而,與抗體相比,適體不會在我們體內(nèi)引起免疫反應,并且易于合成和修飾。此外,適配體的三維折疊結(jié)構(gòu)使其能夠與更廣泛的目標結(jié)合。
適體通常由體外選擇和擴增技術(shù)產(chǎn)生,稱為指數(shù)富集配體系統(tǒng)進化,或 SELEX。簡而言之,SELEX 基于核苷酸的結(jié)合、分離和擴增的重復循環(huán)。這個過程會產(chǎn)生一個豐富的核苷酸序列庫,然后對其進行分析以進行候選選擇。高通量 SELEX (HT-SELEX) 可以生成大量候選適體,但目前實際適用的測序僅允許我們評估有限數(shù)量的這些候選物(大約 10 6)。因此,計算過程對于優(yōu)化新適體的發(fā)現(xiàn)至關(guān)重要。
據(jù)報道,基于變分自動編碼器(VAE,一種機器學習方法)的化合物設計有利于發(fā)現(xiàn)其他小分子。現(xiàn)在,由日本早稻田大學高等科學與工程研究生院的 Michiaki Hamada 教授領導的一組研究人員介紹了 RaptGen,這是一種可用于適體生成的 VAE。在他們于 2022 年 6 月 2 日在Nature Computational Science上發(fā)表的論文中,他們描述了 RaptGen 如何使用帶有輪廓隱藏馬爾可夫模型解碼器的 VAE 來創(chuàng)建序列可以形成簇的潛在空間。通過使用這種潛在表示,RaptGen 能夠生成甚至不包含在原始測序數(shù)據(jù)或 HT-SELEX 數(shù)據(jù)集中的適配體。
當被問及 RaptGen 究竟如何促進適體發(fā)現(xiàn)時,Hamada 教授說:“ RaptGen 首先用序列基序可視化一個潛在空間,然后通過這個潛在空間生成多個新的適體序列。例如,它通過在分析序列子集的活動后考慮附加信息,在潛在空間中搜索優(yōu)化的適體序列。此外,RaptGen 能夠設計縮短(或截斷)的適體序列。”
該團隊還通過使用來自兩個獨立 HT-SELEX 數(shù)據(jù)集的數(shù)據(jù)成功地評估了 RaptGen 的性能。RaptGen 可以以活動引導的方式生成適體衍生物,并提供優(yōu)化其活動的機會。“這很重要,因為這意味著 RaptGen 可以生成具有所需特性的序列,例如抑制某些酶或蛋白質(zhì)-蛋白質(zhì)相互作用, ” Hamada 教授解釋說。這些分子的應用可能會在未來打開許多大門。
展望未來,該團隊計劃進行廣泛的研究,評估替代模型是否可以提高 RaptGen 的性能,以及 RaptGen 是否可以通過使用 RNA 序列來促進 RNA 適體的生成。使用 RaptGen 的缺點是計算成本高和訓練時間增加,這兩者都可以在進一步的研究中得到改進。
Hamada 教授總結(jié)說:“據(jù)我們所知,RaptGen 是可以直接從 HT-SELEX 數(shù)據(jù)設計和優(yōu)化截斷適配體的數(shù)據(jù)驅(qū)動方法。我們相信,在適當?shù)臅r候,RaptGen 將被公認為高效適體發(fā)現(xiàn)的關(guān)鍵工具。”
這是他們對擁有更好療法的健康長壽社會的愿景!
參考
作者: Natsuki Iwano 1、 Tatsuo Adachi 2、 Kazuteru Aoki 2、 Yoshikazu Nakamura 2和Michiaki Hamada 1,3,4
原始論文標題: Generative aptamer discovery using RaptGen
期刊: Nature Computational Science
DOI: 10.1038 / s43588-022-00249 -6
隸屬關(guān)系
1 :早稻田大學科學與工程研究生院
2 : 東京 RIBOMIC Inc.
3 :國立先進工業(yè)科學技術(shù)研究院 (AIST)計算生物大數(shù)據(jù)開放創(chuàng)新實驗室 (CBBD-OIL )
4 : 研究生院日本醫(yī)科大學醫(yī)學系