自然圖像領域中存在著許多海量數據集,如ImageNet,MSCOCO。基于這些數據集產生的預訓練模型推動了分類、檢測、分割等應用的進步。與自然圖像不同的是,醫療影像大部分都是3D結構形態的,同時,由于數據獲取和標注難度大,數據量稀少,此前并沒有海量數據集及對應的預訓練模型開源。
騰訊優圖表示,這正是其開源MedicalNet的原因所在。目前,MedicalNet具備5大特性:
1、預訓練網絡可遷移到任何3D醫療影像的AI應用中,包括但不限于分割、檢測、分類等任務;2、尤其適用小數據醫療影像AI場景,能加快網絡收斂,提升網絡性能;3、通過簡單配置少量接口參數值,即可進行微調訓練;4、提供多卡訓練以及測試評估代碼,接口豐富,擴展性強;5、提供不同深度3D ResNet預訓練模型,可供不同數據量級應用使用。MedicalNet是如何做出來的?騰訊優圖給出了解釋:
MedicalNet聚集了來自多個不同3D醫療領域的語義分割小規模數據集,并提出了基于多分支解碼器的多域聯合訓練模型來解決數據集中的標注缺失問題。這一預訓練的適用性也很強,可以遷移到任何3D醫療影像應用的深度學習模型中。
為了衡量模型效果,他們將MedicalNet模型遷移到預訓練時未接觸過的Visceral和LIDC數據集中。并用它來完成全新的肺部分割和肺結節分類任務,并與目前常用的從零訓練(train from scratch)以及Kinetics視頻3D預訓練模型在性能以及收斂速度上做了比較。
在肺部分割應用上,與Train from Scratch相比,MedicalNet在Dice上有16%到33%幅度的提升,與KineTIcs相比有4%到7%幅度的提升。在肺結節良惡性分類應用上,與Train from Scratch先比,MedicalNet的預測準確度提升了6%到23%幅度,與KineTIcs相比,提升了7%到20%。
在收斂速度上,無論是在肺分割任務還是肺結節分類任務上,MedicalNet都能為模型提供一個較低的初始化損失值,明顯加快損失下降速度。騰訊在AI醫療方面沉淀已久,近年來業內名聲愈盛,刷新多項世界紀錄。比如今年6月,全球胸部多器官分割大賽上,騰訊優圖與廈門大學王連生老師實驗室聯手,刷新3項全球新紀錄。在此此前,雙方也在肝分割、肝腫瘤分割兩項技術挑戰賽中斬獲世界第一。
騰訊優圖表示,其醫療AI已經具備進行上億規模的模型訓練及合作接入的能力。而且,他們不僅僅只是研究,技術落地也早已開始。近年來,這些醫療AI技術正在通過騰訊旗下首個醫療影像產品“騰訊覓影”持續對外輸出,目前已支持宮頸癌、肺癌、糖尿病視網膜病變等癌癥篩查,并在國內100多家頂尖三甲醫院進行落地。