焦點報導

首頁> 焦點報導清單> 生物醫學數據轉譯科學之遠景

生物醫學數據轉譯科學之遠景

洪立萍/ 發布日期:2019/02/15/ 瀏覽次數:117
大數據的應用已在眾多領域中帶來莫大效益,然而,在生物醫學領域,即使數據的質與量皆呈現巨幅增長,實際應用於醫學及臨床照護的速度卻比預期的緩慢。為加速生物醫學數據於精準醫學(Precision Medicine)發展之貢獻,由美國國家衛生研究院(National Institutes of Health,NIH)成立之國家轉譯科學推動中心(National Center for Advancing Translational Sciences,NCATS) 於2016年10月啟動「生物醫學數據轉譯」(Biomedical Data Translator)計畫。該計畫旨在建構一轉譯系統(Translator)的原型(Prototype),以系統性的方法將各種生物醫學資料庫進行整合,並透過理解與關聯性串聯,將數據轉譯(Translate)為有意義的資訊,進而促進轉譯醫學創新研究與提升臨床照護品質。

數據轉譯系統之組成包括: (1)知識源(Knowledge Source,即各種生物醫學數據庫),其中包括各種醫學、生命科學、臨床資訊,例如:臨床症狀、診斷程序與反應、基因、疾病形成要素、病患用藥反應、環境微生物等;(2) 整合知識圖譜(Integrated Knowledge Graph),亦即將知識源中之各種數據進行動態分群(Regrouping),並組織為節點(Nodes)以利於往後各種關聯性之連結;(3) 推理器(Reasoners),其根據學理,針對系統接收的請求或是需要解答的問題,執行解析任務,亦即辨識知識圖譜中符合該需求或能夠解答該問題的正確知識路徑,並將相關的知識節點進行合理地連結。目前該計畫已整合超過40個具有語意標記的知識源,類型涵蓋臨床、環境、實驗研究數據等。使用者對系統提出查詢(Inquiry)後,轉譯系統會辨識出與查詢內容相關的知識源,並運用運算技術將資料的關聯性串接起來以提供新知識或可用且有效的資訊。該計畫團隊之生命科學家與臨床醫學專家正持續為該系統的可信賴度進行評估。

生物醫學數據轉譯系統對於未來醫學與生命科學而言是一基礎網路建設(Cyber-infrastructure),然而,維運整個轉譯系統將是一重大的挑戰。研究團隊認為其主要原因包括:
(1) 由於臨床徵兆與生物分子特性的種類不斷地變化與增長,欲建立一能夠直接將臨床特徵完整地連結至生物分子特性的通用資料庫系統,其可行性並不高。
(2) 生物醫學數據量的持續增加,將使系統本身面臨統計處理能力(Statistical power),亦即運算能力(Computing Power)的挑戰。
(3) 由於各式診療資料與觀察資料,不論是軟體語言或自然語言,皆因測量技術或個人語言使用習慣而有細微的差異。缺乏通用的語言來傳達臨床與生物數據代表著數據處於孤立或邊緣化的風險,並可能導致關鍵資訊在所需時無法被辨識。

最後,研究團隊建議,若要加速臨床及轉譯醫學研究進而提升臨床照護品質,勢必要將跨資料庫間的推理過程自動化,並且,當系統提供轉譯資訊時應同時具備完整的資料來源以及可信度評量分析。
延伸閱讀
資料來源