oidgranny老妇女直播,99久久这里只有精品视频,丁香五月开心婷婷综合免费

您當前的位置：熱點 >

助力新藥研發(fā) 騰訊推全球最大耐藥性數(shù)據(jù)庫

2023-07-06 10:53:20 來源：科技頭條分享

7月5日消息，騰訊公司5日宣布，已搭建一個海量的 MdrDB 耐藥性數(shù)據(jù)庫，提供最全的數(shù)據(jù)信息，為 AI 研發(fā)新藥提供耐藥性預(yù)測測試的「練兵場」。

【資料圖】

據(jù)悉，這是騰訊量子實驗室的最新研究成果，相關(guān)研究論文已登上了國際學(xué)術(shù)期刊 Nature 的子刊 Communications Chemistry。

看過電影《我不是藥神》就知道：癌癥患者后期，使用的靶向藥物經(jīng)常出現(xiàn)耐藥性，需要尋找新的替代藥物。不止癌癥，艾滋和抗生素藥物都會產(chǎn)生耐藥性。這是由于癌細胞和病原體的蛋白突變所導(dǎo)致的。

打個比方，關(guān)鍵蛋白是解決癌細胞/病原體的「門鎖」，但由于細胞進化和藥物刺激，蛋白突變幾乎不可避免。而無法預(yù)知蛋白的突變方向，就無法定向研發(fā)能夠解決疾病的藥物來做“鑰匙”。

AI 學(xué)習(xí)，可以為預(yù)測蛋白、研制新藥提速。但全世界都面臨的最大問題是——蛋白突變的數(shù)據(jù)樣本不足，對耐藥性測試造成了很大的數(shù)據(jù)缺口。

針對數(shù)據(jù)量不足，騰訊發(fā)布的 MdrDB 耐藥性數(shù)據(jù)庫，首先在量上做到第一：從包括 GDSC、DepMap 等公開的行業(yè)數(shù)據(jù)集內(nèi)，搜集了接近 10萬個樣本，總共收納了 240 種蛋白質(zhì)(總共 5119 個 PDB 結(jié)構(gòu))、2503 個突變和 440 種藥物，涵蓋了各種蛋白質(zhì)家族的突變信息。

這個樣本量總共達到了 10 萬，是行業(yè)第二名的 100 倍。豐富的數(shù)據(jù)量，能夠為 AI 進行藥物的耐藥性測試提供足夠的訓(xùn)練樣本。

為了讓 AI 更好消化數(shù)據(jù)，量子實驗室耗時半年，搭建了一套數(shù)據(jù)的加工流程：通過細胞系的數(shù)據(jù)清洗，數(shù)據(jù)庫內(nèi)將野生型蛋白、突變性蛋白等蛋白質(zhì)類型，單點突變、刪除突變等突變類型分門別類，方便AI隨時「調(diào)閱」。

最后，通過自研的 Mutfold 蛋白質(zhì)突變預(yù)測平臺和蛋白質(zhì)折疊算法，能就生成一個可視化的蛋白質(zhì)三維結(jié)構(gòu)「鎖孔」樣本，可供進行藥物分子的結(jié)合模擬，提供耐藥性數(shù)據(jù)。

新藥研發(fā)，必須經(jīng)過大量的測試，以確認能夠匹配突變蛋白。更全面、更多維的數(shù)據(jù)庫，能更有效助力進行突變誘導(dǎo)耐藥性的預(yù)測、聯(lián)合治療策略的開發(fā)以及創(chuàng)新藥物的研發(fā)。

在海量數(shù)據(jù)的加持下，MdrDB 也實現(xiàn)了性能的突破：在就 MdrDB 與其它行業(yè)公開耐藥數(shù)據(jù)庫作為訓(xùn)練數(shù)據(jù)、分別在10種經(jīng)典機器學(xué)習(xí)模型上進行測試的實驗中，與其它數(shù)據(jù)庫相比，模型的預(yù)測值與真實值的均方根誤差從 0.907 下降至 0.656，相關(guān)性從 0.094 提升至 0.607，耐藥性的分類性能則從 0.243 提升至 0.538。

經(jīng)過測試，使用 MdrDB 的AI耐藥性預(yù)測精準度提升30%。這也是自2020年打造 AI 藥物研發(fā)平臺云深智藥(idrug)以來，騰訊又一次探索前沿技術(shù)助力藥物研發(fā)。

目前，MdrDB 已向行業(yè)和學(xué)術(shù)機構(gòu)全面開放。未來，MdrDB 還將持續(xù)更新耐藥性數(shù)據(jù)。

關(guān)鍵詞：新藥研發(fā) 耐藥性數(shù)據(jù)庫騰訊公司人

>>返回頻道首頁

返回本網(wǎng)站首頁

[責(zé)任編輯：ruirui]

熱點排行

關(guān)于我們| 客服中心| 廣告服務(wù)| 建站服務(wù)| 聯(lián)系我們

中國焦點日報網(wǎng) 版權(quán)所有滬ICP備2022005074號-20，未經(jīng)授權(quán)，請勿轉(zhuǎn)載或建立鏡像，違者依法必究。