无码综合天天久久综合网色吧影院,四虎成人精品永久网站,久久久国产99久久国产久一,亚洲AV无码一区二区二三区∝

?
投資 干貨 消費 評論 學院 滾動
風投 科技 創(chuàng)業(yè) 業(yè)內 要聞
IO500全球榜單八強!附屬瑞金醫(yī)院轉化醫(yī)學大科學設施ASTRA平臺打破行業(yè)天花板
發(fā)布日期: 2021-11-24 13:43:23 來源: 上海交通大學醫(yī)學院

近日,國際超級計算大會SC21正式公布全球最新IO500榜單。附屬瑞金醫(yī)院轉化醫(yī)學大科學設施建設的大數據平臺ASTRA,在代表全球頂尖數據存儲性能的IO500全球榜單上,獲得全球第八。據悉,該榜單上強手如林,包括了華為、intel、谷歌等國際大公司以及鵬城實驗室、阿貢國家實驗室、廣州、長沙等國內外國家級超算中心巨頭。

IO500 10-node 效能榜:https://io500.org/list/sc21/ten)

轉化醫(yī)學大科學設施是首次參評的醫(yī)療機構,該平臺由瑞金醫(yī)院同仁和intel工程師一起經過近半年的準備和技術反復優(yōu)化,最終提交評測。

目前在AI和大數據向各行各業(yè)滲透,元宇宙概念方興未艾的時代背景下,算力和存儲性能是評價超算平臺尤為重要的兩個指標,如果說算力是車的話,存儲就是路,好車需要有好路,而在生信領域組學數據容量巨大的環(huán)境下更是如此。

轉化醫(yī)學大科學設施研究員呂綱說,轉化醫(yī)學大科學設施的ASTRA平臺是醫(yī)學生信領域第一臺能在存儲性能上沖進全球榜單前十名的高性能生信大數據系統,從存儲性能上打破了生信行業(yè)的天花板,隨著高性能計算技術與醫(yī)學研究的融合,高效的存儲技術會對未來生信分析和AI技術在臨床的應用帶來重要的推動作用。

項目由瑞金醫(yī)院國家轉化醫(yī)學中心生信大數據平臺建設完成,此次研究團隊成員包括生信大數據團隊負責人方海、共同負責人呂綱以及徐敏、代雨婷、喬妞、郜晨序、桂團團、王學龍、包超慧等共同完成,由呂綱領銜完成項目實施,該項工作得到了國家轉化中心主任陳賽娟院士的關鍵性指導,以及瑞金醫(yī)院院領導的大力支持。

ASTRA平臺

ASTRA平臺隸屬于轉化醫(yī)學國家重大科技基礎設施(上海)生信大數據平臺。轉化醫(yī)學國家重大科技基礎設施(上海)是“十二五”期間國家重點規(guī)劃的16項重大科技基礎設施之一,于2013年7月經國家發(fā)展和改革委員會正式批準建設,是我國在生物醫(yī)藥領域第一家國家級大設施。上海交通大學和上海交通大學醫(yī)學院附屬瑞金醫(yī)院為大設施兩大建設主體。

生物標記物和新藥研發(fā)平臺是轉化醫(yī)學國家重大科技基礎設施技術支撐系統的重要組成之一。其目標是建立致力于提供系統鑒定用于疾病早期診斷、預防、分子分型和指導個體化治療的生物標記物的平臺,并圍繞臨床實踐建立系統篩選與驗證干預疾病的藥物靶點及研發(fā)新型靶向治療方法的平臺,為新型疾病診療研發(fā)開辟一條快捷的新途徑。

生信大數據平臺對生物標記物和新藥研發(fā)提供“生信”及“計算”基礎,包括生信分析、算力支撐、數據存儲等,主要將圍繞基因組測序、轉錄組測序、蛋白質組學、代謝組學、藥物篩選等各種先進組學檢測技術與平臺,緊密結合各種患者生理生化指標,組織病理檢查、器官影像檢查、家族遺傳背景、疾病歷史診療信息等形成多維度的數據流,然后通過各種生物信息學手段進行原始數據的綜合分析和挖掘,提供與疾病診斷和治療相關的遺傳和臨床信息。待形成特征數據,再通過機器學習、深度學習和人工智能算法整合特征數據與臨床診療的方案,從而形成真正意義上的精準分析、輔助診斷和個性化醫(yī)療。在運行過程中,對豐富的臨床診療和組學科研數據進行有機存儲,提供包括各種相關數據檢索、統計分析、圖形化呈現在內的大規(guī)模數據挖掘能力,支持轉化醫(yī)學的醫(yī)療、科研人員進行總結和探索性的科研工作。

生信大數據平臺的關鍵性性能

在轉化醫(yī)學的背景下,生信大數據平臺采取了定制化的高性能計算平臺技術思路,為生信計算的“存”“傳”“算”“用”四個方面(即:數據存儲、數據傳輸、數據分析計算和數據的整合應用)量身定制。包括了圍繞數據的全生命周期建立組學原始數據的高效存儲和讀出技術、數據存儲跨廣域網的數據傳輸技術、高效的并行計算體系和前沿的數據計算方法以及數據計算結合的跨組學整合、數據建模評估方法和形成對臨床科研上的應用。為了適應轉化醫(yī)學中心對數據存儲和數據分析多層次復合型的需求,大數據分析平臺的架構需要具有適合大規(guī)模計算,數據挖掘,支持橫向擴展和跨平臺移植等特性。

生信大數據核心硬件平臺主要包括液冷計算節(jié)點和融合計算節(jié)點,計算系統擁有高性能cascade lake計算核心超過4160核,雙精度計算能力超900萬億次以及目前AI計算能力最強的服務器DGX-A100等GPU計算節(jié)點,AI計算能力超15Peta AI Flops,以及云服務器節(jié)點與多路胖節(jié)點等。系統采用200Gb HDR inifiniband高速核心計算網絡。存儲系統采用分層的高速分布式并行文件系統與超高速異步對象存儲構成,存儲容量為10PB,兼顧容量和性能,提供充足的數據存儲資源和計算資源來支撐各種多組學研究計算需求,數據能與國內國際研究社區(qū)進行有效互聯互通,有效整合;

生信大數據平臺的支撐作用

5月20日,《自然》雜志在線發(fā)表了一篇來自上海市公共衛(wèi)生臨床中心與轉化醫(yī)學國家重大科技基礎設施(上海)以及瑞金醫(yī)院等單位合作研究的題為《與新冠臨床結果相關的病毒和宿主因素》的論文,對上海市公共衛(wèi)生臨床中心在2020年1月20日-2月25日期間收治的326例患者,進行了病毒基因組、臨床表現特點、免疫反應改變等數據的全面深度分析。揭示了新型冠狀病毒性肺炎的分子流行病學和臨床表現特征,尤其是發(fā)現了向重癥轉化的關鍵預警因子。這其中從1月27日收到第一例測序樣本到完成基因組組裝和臨床數據分析、向國際數據庫遞交了112個病例的SARS-CoV-2基因組高質量序列數據,以及文章撰寫提交等只用了短短45天時間,這其中2020年1月剛剛上線ASTRA平臺提供了強勁的算力和存儲支撐、可謂功不可沒。

此外在新冠研究過程中建立了具有重要公共衛(wèi)生安全意義的應用算法平臺,對國家疾病防控研究有所助益。

該平臺目前開設了對外服務,主要包含三類:

1、計算類服務:主要包括并行計算服務、虛擬化計算服務、數據存儲、數據歸檔等;

2、組學通用分析服務:WES/WGS分析、RNAseq轉錄組分析、單細胞數據分析、病原微生物數據分析等;

3、大數據服務:數據采集、清洗、AI數據標注、AI建模、AI數據推理等;

4、組學深層解析:主要包括多組學數據二維聚類分析、多組學數據整合分析、潛在治療靶點預測分析等。

IO500是高性能計算領域針對存儲性能評測的全球排行榜,是高性能計算領域最權威的榜單之一。超算系統包括計算系統和存儲系統。TOP500是針對計算系統算力性能排名,而IO500主要針對存儲系統性能進行排名。自2017年11月開始,每年IO500榜單會在高性能計算領域的頂級會議——美國的Supercomputing Conference(SC,全球超級計算大會)和德國的International Supercomputing Conference(ISC,國際超級計算大會)大會上發(fā)布。自提出以來已經得到了包括大學、國家實驗室在內的研究機構和商業(yè)公司的廣泛公認。最新的榜單已與11月18日在2021年國際超算大會(SC21)公布。

IO500測試為了全面反應存儲在各類不同工作狀態(tài)中的性能,通過模擬應用需要的不同IO模型,來考察數據帶寬(GIB/s)和元數據(KIOP/S)兩個關鍵維度的性能表現,各項分數取幾何平均后得到總分。與Top500榜單相對平穩(wěn)的排名和趨勢相比,IO500榜單的競爭顯得異常激烈。IO500包括總榜單及10節(jié)點榜單兩大類別。其中,10節(jié)點榜單統一了客戶機的規(guī)模,也更接近于日常使用的狀態(tài),更能反映存儲系統可為實際程序提供的I/O性能的效率,參考價值更高。

關鍵詞: 瑞金 天花板 附屬
24小時熱點 精彩推薦
資訊新聞
?