醫療影像AI落地難 數據應用有“三痛”
瞭望站
“AI的‘燃料’是數據。”近日,在超聲大數據與人工智能應用與推廣大會上,上海交通大學附屬瑞金醫院教授詹維偉打了一個形象的比喻,他說,驅動AI落地臨床,數據的可用性起著基礎性的作用。
“頂級期刊刊發的關於醫學影像AI的論文大多需要大樣本(10萬以上)數據庫訓練。”詹維偉說,海量的數據意味著數據可用、不被污染、且能實現標准化。
而事實上,中國的醫學數據看似很多,但是可用性並不高,正是因為存在被污染、信息不健全、難以標准化的三大“痛點”。東南大學生物科學與醫學工程學院教授萬遂人表示,在多中心的數據庫建立過程中,經常出現對同一醫學問題的不同說法。他認為需要經過幾年的時間,完成行業標准的工作。
另一方面數據的不統一還存在一定的客觀原因,例如不同品牌的儀器成像機理和標准不同,因此對於同一病灶輸出的影像並不相同,這也大大提高了數據庫標准化的難度。
為此專家呼吁相關機構進行數據的標准化工作。“整個醫學人工智能的基礎是大數據,大數據的基礎是我們數據樣本的標准庫是否建立。”國家衛生健康委員會規劃信息司信息處處長沈劍鋒表示,標准的醫學影像數據庫不僅應該對數據進行標准化,還應該對病灶有清晰的標注,且兼顧年齡分布、疾病分類等其他維度的信息。
據介紹,國家衛生健康委員會已經開始著手進行國家層面的數據標准庫的建立。並發布了《全國醫院信息化建設標准與規范》《全國醫院數據上報管理方案》等指導性文件,對包括數據在內的相關信息進行標准規范。
“擁有大數據的第三方公司也應該在數據規范方面從事更多的工作。”詹維偉說。
美年大健康集團董事長俞熔對此表示認同,他說:“我們的600家運營機構去年為兩千多萬人次提供體檢服務,龐大的流量和數據理應承載更多的科研和技術突破的責任。未來將加強相關標准化數據的採集、質量控制、數據分析工作,以便將數據提供給權威部門,助力建立醫學影像的專業數據庫。”
當天,大數據算法與分析國家工程試驗室杭州創新中心、浙江省數理醫學學會、美年大健康集團三方達成合作,共建超聲大數據庫。醫學影像AI合作開發聯盟同步成立,並發出倡議呼吁各方積極推動資源的高效配置,推動醫學影像AI技術落地,通過聯合研發共同開展國家級和省市級重大專項、產業化基金、科技發展基金等項目的立項、申報和項目的執行工作,實現產學研的優勢結合。(張佳星)
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注