3月23日,由前沿科技媒體機器之心主辦的“AI科技年會”上,美國芝加哥豐田計算技術研究所教授許錦波在演講中宣布歸國加入國家級實驗室,并分享了AI預測蛋白質結構和功能這一新興領域的發展沿革與最新進展。
許錦波被業界譽為“AI預測蛋白質結構全球第一人”,早在2016年,他開發的RaptorX-Contact方法,首次證明了深度學習方法預測蛋白質結構的可行性,拉開了AI蛋白質結構預測時代的序幕。谷歌DeepMind開發的AlphaFold軟件也是基于許錦波團隊前期研究成果。
許錦波表示,準確描述蛋白質的結構和功能,是理解生命過程的基礎。蛋白質的結構和功能聯系緊密,預測蛋白質的結構有助于人們在原子層面了解蛋白質的功能。近年來,隨著人工智能的又一次興起,蛋白質的結構預測從傳統的物理和統計方法,快速走向最新的機器學習乃至深度學習算法。深度學習技術顛覆了蛋白質結構預測,可以正確預測90%的蛋白質形狀,其中50-60%的蛋白質可以做到高分辨率預測,在此基礎上,推動分子生物學界的研究范式從基于序列的研究到基于結構的研究,進而促進了基于結構的藥物發現和設計,提高了蛋白質從頭設計的效率。
眾所周知,細胞是構成生命體的基本單位,而蛋白質則是構成細胞的重要生命物質,是生命活動的體現者和承擔者。這其中,蛋白質分子的組成及其折疊結構,在很大程度上決定了蛋白質所具備并正在發揮的生物學功能。然而,如何清晰“理解”蛋白質的折疊結構,是困擾生物學界的一個“世紀難題”。一旦解開,人類對于生命的理解將邁出飛躍性的一步。
以當下火熱的生物醫療產業為例,利用細胞、組織、體液等制造的一系列生物醫療制品,如單克隆抗體、重組蛋白、疫苗及基因和細胞治療藥物等大分子藥物,因功效普遍較化學藥更高且毒副作用小,近年來得到醫療產業界越來越多的關注,市場規模增長率遠高于化學藥。通過AI對蛋白質結構和功能進行預測,可以幫助人們深入了解包括癌癥、遺傳病等諸多頑疾的發病機理,進而找到治療更精準的路徑;同時,借助AI進行蛋白質結構優化,還可以極大地提升大分子藥物的研發效率、降低成本。
而除了醫療產業以外,由于蛋白質可用作為諸如酶和激素之類的生物催化劑,在食品、化工、能源、環境工程等諸多領域有有著廣泛的應用,可想而知,用AI破解蛋白質結構之謎、并在此基礎上進行結構設計和優化,可以給未來社會發展帶來怎樣天翻地覆的變化。
過去的近六年時間里,許錦波在AI蛋白質結構預測領域做出了開創性的貢獻。
2016年,許錦波開發出基于殘差網絡(ResNet)的RaptorX-Contact方法,其采用全局式的結構預測方式,將圖像處理中的圖像分割技術遷移到蛋白質結構預測領域,采用深度學習卷積網絡對蛋白質結構進行整體測算,并通過距離矩陣重構蛋白質分子三維結構,從而大幅度提高了蛋白質結構預測。同年,在被稱為“蛋白質結構預測領域的奧林匹克競賽”——第十二屆國際蛋白質結構預測競賽(CASP,Critical Assessment of protein Structure Prediction)中,RaptorX-Contact在蛋白質接觸矩陣的預測上得分居首位。這一蛋白質結構預測的核心思想得到了谷歌DeepMind團隊的重視,并應用在AlphaFold的開發中。
除了開辟AI蛋白質預測的新思路之外,許錦波團隊還研發了多個著名的生物信息學軟件,包括蛋白質相互作用網絡分析軟件IsoRank。去年以來,許錦波團隊繼續通過使用殘差網絡(ResNet),在不使用協同進化(co-evolution)信息的條件下,實現了較高的蛋白質結構預測水平,并在預測人工設計的蛋白質結構時表現得更為出色。這一研發成果對蛋白質工程和蛋白質設計都具有重要意義。
許錦波教授將加入聚焦生命科學領域、代表國家戰略科技力量的北京昌平實驗室,并將在此繼續圍繞蛋白質預測與設計開展科研攻關。
請輸入驗證碼