近日,中國工程院院士、南方海洋科學與工程廣東省實驗室(廣州)教授包振民團隊開發國際首個整合宏觀/微觀進化基因組和功能基因組的綜合分析工具(PanSyn,https://github.com/yhw320/PanSyn)。相關成果發表于《自然-實驗手冊》。該成果是包振民團隊長期積累的豐富基因組學分析方法和工具研發經驗的系統總結和提升。
闡釋基因組的結構和功能是解碼地球生命史和生物多樣性的核心。高通量測序技術的革命性突破及各類組學技術的廣泛應用,為生命科學領域帶來前所未有的發展契機,推動生命科學研究快速進入大數據時代。深度挖掘復雜、高維度的海量組學資源已成為當前生命科學領域面臨的巨大挑戰。對大部分生物類群(特別是非模式海洋生物)而言,至今缺乏深度系統的基因組學分析工具,難以滿足日益增長的對復雜海量組學數據的分析需求。

整合宏觀/微觀進化基因組和功能基因組的綜合分析工具PanSyn流程概覽。受訪者供圖
基因組共線性分析為比較基因組學研究提供了基本框架。現存物種基因組間/內和祖先與現存物種基因組之間的基因組共線性分析是闡明基因組結構、調控元件及其進化史的關鍵步驟。目前大多數共線性分析方法主要集中在微觀進化尺度上,或僅在微觀或宏觀單一進化尺度上進行研究,鮮有對兩個尺度的綜合分析,嚴重阻礙了對基因組的泛進化歷程及其背后蘊藏的功能意義的全面理解。因此迫切需要開發一種全面且系統的比較基因組學分析工具,以深刻解析基因組結構與功能進化的本質規律。
針對上述國際基因組學領域面臨的共性挑戰,包振民團隊開發了迄今最全面系統的整合宏觀/微觀進化基因組和功能基因組的綜合分析工具PanSyn,其不僅包含功能全面的微觀共線性分析模塊,還極大彌補了宏觀共線性分析工具匱乏的局面,并創新提出整合微觀和宏觀共線性以及調控組學數據的集成式分析模塊。
與主流軟件和工具相比,PanSyn具有顯著優勢:一是,微觀共線性分析方面,可實現從單一到多重比對、從簡單到復雜倍性、從低維到高維網絡、從結構到功能的全面微觀共線性分析;二是,宏觀共線性分析方面,可實現祖先基因組重建、古老基因家族聚類、核型保守性估算以及染色體進化過程系統推斷;三是,整合分析模塊方面,首次提出從微觀到宏觀(自下而上)和從宏觀到微觀(自上而下)的雙重整合策略,實現祖先與現存物種之間的基因組泛進化尺度的系統推演和解析。同時實現整合多維功能組學數據,為理解基因組進化提供更全面深入的功能解讀視角。
PanSyn是國際首個整合宏觀/微觀進化基因組和功能基因組的綜合分析工具。PanSyn將為全面解析基因組進化和功能、基因資源開發利用等提供有力工具,以助推生命科學領域的創新發現和重大突破,實現最終描繪出整個生命之樹的發展演變的全貌。
相關論文信息:https://doi.org/10.1038/s41596-024-00966-4