澳门金沙娱乐城官网-金沙官网

北理工團隊合作基于遷移學習生成物種特異性啟動子方面取得重要進展


近日,北京理工大學霍毅欣教授與郭淑元教授團隊在基于生成式機器學習生成物種特異性啟動子方面取得重要進展。相關研究成果以“Species-specific design of artificial promoters by transfer-learning based generative deep-learning model”為題發表在頂級期刊《Nucleic Acids Research》(影響因子:14.9)。該工作以北京理工大學為第一通訊單位,博士生夏燕為第一作者,霍毅欣教授與郭淑元教授為共同通訊作者。

啟動子是在轉錄水平上調節基因表達的關鍵元件,能夠啟動基因轉錄、調節基因表達,并影響代謝途徑中的代謝流分布。盡管天然啟動子已被用于基因調控,但其缺乏連續的調控強度和廣泛的調控范圍。目前,深度學習在蛋白質設計、調控元件生成等領域已經取得了一定的進展,但是在數據集缺乏的條件下還不能生成質量較高的調控元件。為了解決原核生物啟動子數據量不足的問題,我們基于遷移學習的策略,開發了一系列核苷酸語言模型 PromoGen,用于在數據缺乏的條件下從頭生成物種特異性的啟動子(圖1)。

8ba7d169a78f48c790b2c31921a657a9.png

圖1 基于核苷酸語言模型的啟動子設計架構

通過位置權重矩陣、6聚體頻率相關性和 -10 區域分布分別對 B. subtilis 的PromoGen-bsu模型生成啟動子的能力進行分析。并對PromoGen-bsu生成的啟動子進行濕實驗驗證,結果表明72.7%的生成啟動子的活性高于天然啟動子PlepA的啟動活性的三倍,18%的啟動子與天然強啟動子活性水平相當(圖2)。

066082c82921458f93baec2459598782.png

圖2 生成啟動子在枯草芽胞桿菌中的活性驗證

為了證明遷移學習策略的有效性,分別使用27個物種的啟動子的數據,在PromoGen-pre上對其進行微調,得到了27個物種的生成模型。并對所有的模型進行預訓練和微調性能評估,微調后的32%的模型相關性超過0.8。此外,我們開發了一個在線平臺(https://promogen1.cloudmol.org/),該平臺針對27種原核生物提供了微調后模型來從頭生成啟動子(圖3)。

8ea72d900edc49339d65bcfb444465e9.png

圖3 網絡服務器示意圖

此項工作得到了國家重點研發計劃(Grant No. 2021YFC2100500),國家自然科學基金委(Grant No. 32370095, 32371489, 62325202)和唐山市科技計劃(Grant No. 23130228E)基金的支持。


分享到:

大发888娱乐城真钱| 百家乐官网客户端LV| 娱乐城百家乐怎么样| 亿酷棋牌世界下载手机版| 柬埔寨百家乐官网的玩法技巧和规则| 死海太阳城酒店| 新锦江百家乐官网娱乐场| 大发888娱乐城shouye| 易胜博百家乐官网娱乐城| sz新全讯网新112| 有钱人百家乐官网的玩法技巧和规则 | 百家乐筹码桌布| 好运来百家乐官网现金网| 墨尔本百家乐官网的玩法技巧和规则 | 大发888注册页| 送58百家乐官网的玩法技巧和规则 | 百家乐棋牌辅助| 大名县| 百家乐筹码防伪套装| 总格24名人| 太阳城二手房| 赌百家乐官网的心得体会| 大发888娱乐城官方下载| 全迅网百家乐官网的玩法技巧和规则| 盛世国际娱乐场| A8百家乐娱乐网| 百家乐官网群shozo| sz全讯网网站xb112| 玩百家乐官网的好处| 至尊百家乐官网节目单| 凯时娱乐城官网| 宝龙百家乐官网的玩法技巧和规则 | 网上百家乐官网娱乐场开户注册 | 成都百家乐牌具| 土豪百家乐官网的玩法技巧和规则 | 立博百家乐官网的玩法技巧和规则| 同乐城备用| 电脑百家乐的玩法技巧和规则 | 百家乐官网怎么稳赚| 大发888新网址| 兄弟百家乐的玩法技巧和规则|