近日,《自然》雜志對“可能在未來一年對科學產生影響”的7項技術進行了綜述。這些技術包括完整版基因組、蛋白質結構解析、量子模擬、精確基因組調控、靶向基因療法、空間多組學、基于CRISPR的診斷等。
完整版基因組
2019年,當端粒到端粒(T2T)合作組成立時,大約有1/10的人類基因組仍然未知。但現在,這個數字已經降到了零。在2021年5月發表的一篇預印本論文中,該合作組報告了第一個人類基因組的端到端序列,為廣泛使用的人類參考基因組序列GRCh38增加了近2億個堿基對,并為人類基因組計劃完成了最后一章。
GRCh38于2013年首次發布,是一個很有價值的研究工具,也是繪制測序序列的支架。但它們不夠長,不足以清晰地繪制高度重復的基因組序列。
長讀長測序技術被證明是之前規則的“改變者”。這一技術由美國太平洋生物科學公司和英國牛津納米孔技術公司開發,可以在一次讀取中對數萬甚至數十萬個堿基進行排序。2020年,當T2T合作組首次重組單獨的X染色體和8號染色體時,太平洋生物科學公司的測序工作進展已經可以讓T2T合作組科學家檢測到長片段重復序列的微小變化。這些微妙的“指紋”使長而重復的染色體片段變得容易處理,基因組的其余部分很快歸位。牛津納米孔技術公司平臺還捕獲了許多調節基因表達的DNA修飾,T2T合作組能在全基因組范圍內繪制這些“表觀遺傳標記”。
美國洛克菲勒大學遺傳學家、脊椎動物基因組項目主席Erich Jarvis說:“我認為,在未來10年內,端粒到端粒的基因組組裝將是一種常態。”
蛋白質結構解析
過去兩年,實驗和計算方面的進展提供了“互補”的工具,讓研究人員以前所未有的速度和分辨率確定蛋白質結構。
位于英國的DeepMind公司開發的AlphaFold2結構預測算法依靠“深度學習”策略,從折疊蛋白質的氨基酸序列推斷其形狀。自從2021年7月公開發布以來,AlphaFold2已應用于蛋白質組學研究,以確定在人類和20個模式生物中表達的所有蛋白質結構,以及鑒定Swiss-Prot數據庫中近44萬種蛋白質的結構。同時,冷凍電鏡(cryo-EM)的改進也使研究人員能用實驗方法處理最具挑戰性的蛋白質及其復合物。cryo-EM用電子束掃描快速冷凍的分子,生成多個方向的蛋白質圖像,然后通過計算將其重新組裝成3D結構。cryo-EM硬件和軟件的改進,使得兩個團隊在2020年獲得了1.5埃以下的結構分辨率,確定了單個原子的位置。
還有一種名為冷凍電子斷層掃描的相關的技術也相當令人興奮,這種方法可以在冰凍細胞的薄片上捕捉到自然發生的蛋白質行為。
量子模擬
量子計算機以量子比特的形式處理數據。通過名為糾纏的量子力學現象耦合在一起,量子比特可以在一定距離內相互影響,并顯著提高計算能力。
多個研究團隊已成功地將單個離子用作量子比特,但它們的電荷使其難以進行高密度組裝。法國國家科學研究中心的Antoine Browaeys和美國哈佛大學的Mikhail Lukin等物理學家正在探索另一種方法。研究小組使用光學鑷子在緊密排列的2D和3D陣列中精確固定不帶電的原子,然后用激光將這些粒子激發成大直徑的里德堡原子,使其與附近原子糾纏。
短短幾年時間里,技術進步提高了里德堡原子陣列的穩定性和性能,量子比特數量也從幾十個迅速擴展到幾百個。
Browaeys估計,這種量子模擬器在一兩年內就可能商用。這項工作也為量子計算機的更廣泛應用鋪平了道路。
精確基因組調控
盡管CRISPR-Cas9技術擁有強大的基因組編輯能力,但它更適合于讓基因失活而非修復。這是因為盡管將Cas9酶靶向基因組序列相對精確,但細胞對隨后雙鏈切割的修復卻并不精準。
美國哈佛大學化學生物學家劉如謙表示,大多數基因疾病需要的是基因修正而非基因破壞。為實現這一目標,劉如謙團隊已經開發了兩種很有前景的方法。
兩種方法都利用了CRISPR的精準靶向能力,同時限制了Cas9在該位點切割DNA的能力。第一種方法被稱為堿基編輯,它將催化受損的Cas9與一種酶結合,這種酶有助于一種核苷酸向另一種核苷酸的化學轉化。不過,目前只有特定的堿基—堿基轉換可以利用這種方法實現。第二種方法被稱為引導編輯,它將Cas9與逆轉錄酶相聯系,并使用一種經過修改的向導RNA,以將所需的編輯內容整合到基因組序列中。通過多階段生化過程,這些成分將向導RNA復制到最終取代目標基因組序列的DNA中。
重要的是,這兩種方法都只切割一條DNA鏈,對細胞而言,這是一個安全性更高、破壞性更小的過程。
靶向基因療法
基于核酸的藥物可以在臨床上產生影響,但其可應用的組織仍有諸多限制。大多數治療需要局部給藥或自患者體內提取細胞進行體外處理,然后再移植回患者體內。
腺相關病毒是許多基因療法的首選載體。動物研究表明,仔細挑選合適的病毒,結合組織特異性基因啟動子,可以實現局限于特定器官的高效藥物遞送。然而,病毒有時很難大規模生產,還會引起免疫反應,破壞療效或產生不良反應。
脂質納米粒是一種非病毒載體,過去幾年發表的多項研究顯示了對其特異性進行調控的潛力。例如,美國得克薩斯大學西南醫學中心生物化學家Daniel Siegwart和同事開發的選擇性器官靶向技術有助于快速生成和篩選脂質納米粒,以找出能有效靶向組織(如肺或脾臟)細胞的納米粒。
空間多組學
單細胞組學的發展意味著研究人員能很容易地從單個細胞中獲得遺傳學、轉錄組學、表觀遺傳學和蛋白質組學方面的見解。但單細胞技術將細胞從其原始環境中剝離出來,這一過程可能遺漏關鍵信息。
2016年,瑞典皇家理工學院的Joakim Lundeberg團隊提出了一種處理這一問題的策略。該團隊用條形碼寡核苷酸(RNA或DNA的短鏈)制備了載玻片,這些條形碼寡核苷酸可以從完整的組織切片中捕獲信使RNA,這樣每個轉錄本都可以根據其條形碼對應到樣本中的特定位置。
此后,空間轉錄組學領域迎來了爆發性的發展。目前,已有多種商業系統可用,學術研究團隊也繼續研發新方法,以更好的深度和空間分辨率繪制基因表達圖譜。比如,現在有研究團隊正在他們的空間圖譜上疊加組學數據。Lundeberg團隊也改進了他們的空間轉錄組學方法,以同時捕獲DNA序列數據,這使得他的團隊可以開始繪制腫瘤發生背后的時空事件。
基于CRISPR的診斷
CRISPR-Cas系統精確切割特定核酸序列的能力,源于其作為細菌“免疫系統”抵御病毒感染的作用。這一聯系啟發了該技術的早期采用者思考其對病毒診斷的適用性。
Cas9是基于CRISPR的基因組操作的首選酶,但基于CRISPR診斷的大部分工作都使用了一個名為Cas13的靶向RNA分子家族。這是由于Cas13不僅能切割向導RNA所靶向的RNA,還能對附近的其他RNA分子進行“旁系切割”。許多基于Cas13的診斷都使用報告RNA,將熒光標記“拴”在抑制熒光的淬滅分子上。當Cas13識別病毒RNA并被激活時,它會切斷報告基因并從猝滅分子中釋放熒光標記,產生可被檢測的信號。有些病毒會釋放很強的信號,可以在不擴增的情況下檢測到,大大簡化了即時診斷。
例如,研究人員就展示了一種快速、基于鼻拭子的CRISPR-CAS試驗,使用手機攝像頭對新冠病毒進行無擴增檢測。
其他Cas酶有望繼續擴充這個診斷工具箱,包括Cas12蛋白,他們表現出與Cas13相似的特性,但其目標是DNA而非RNA。這些酶可以檢測范圍更廣的病原體,甚至可以有效診斷其他非傳染性疾病。