2018年10月25日,獲悉,AWS(亞馬遜網絡服務)將加入NIH(美國國立衛生研究院)STRIDES(發現、實驗和可持續性的科學和技術研究基礎設施)計劃,利用AWS云端的先進技術促進生物醫學的創新研究。
STRIDES計劃于2018年7月推出,旨在為NIH生物醫學研究人員提供商業云計算服務。最初,NIH的工作重點是幫助研究人員獲得高價值數據集,并嘗試用新的方法來優化技術密集型研究。 STRIDES計劃是NIH共同基金數據管理新模式(NMDS)的組成部分,NMDS的另一組成部分是NIH數據共享測試計劃,該計劃旨在測試將高價值生物醫學數據集納入云計算系統,建立和評估使用數據的最佳方法。AWS是繼Google Cloud之后加入STRIDES計劃的第二家云服務提供商。
AWS是亞馬遜的子公司,它以付費訂閱的方式向政府、公司和個人提供按需云計算平臺服務,該服務始終允許訂閱用戶通過網絡訪問虛擬計算機數據集。
NIH與AWS達成的協議將幫助NIH研究人員以及全國2500多所學術機構的研究人員獲得NIH的資助以及AWS的一系列技術。STRIDES項目的負責人希望通過與AWS這類的商業云服務提供商(CSP)合作提供的數據能夠達到生物醫學研究界認可的可查找、可訪問、可互操作和可重用(FAIR)的標準。
他們還希望AWS直接與NIH及其資助的研究人員合作,開發和測試新的方法,組建更多的數據集和相關的計算工具,供更廣泛的研究群體使用和訪問。CSP和NIH 數據共享測試階段的研究人員將為三個測試用數據集建立云存儲服務,同時設置準則、制度和流程。在完成一系列試點計劃以及修訂該計劃的制度和程序后,這項服務將提供給NIH資助的研究機構。
NIH資助的三個測試用數據集是基于他們在生物醫學研究界的價值、數據的多樣性以及基礎研究和臨床研究的覆蓋率而決定的。
目前,這三個數據集包括以下內容:基因型——組織表達 (GTEx)數據集,GTEx數據集探索人類基因在不同組織中的表達和調控方式,以及基因組變異在改變基因表達中的作用;基因組資源整合(AGR),AGR數據集由6個MOD(模型生物數據庫)組成,MOD為模式生物的深度研究提供深層次的生物學數據;精準醫學的Trans-Omics(TOPMed),TOPMed數據集收集并配對全基因組測序(WGS)。