科技議題

首頁> 科技議題 - 生醫健康> 人工智慧擴增技術應用於分子診斷
人工智慧擴增技術應用於分子診斷 AI Augmentation in Molecular Diagnostics
2022/01
Frost & Sullivan
www.frost.com
一、 簡介

人工智慧(Artificial intelligence)與其子領域:機器學習(Machine Learning)、深度學習(Deep learning)為現今健康照護裝置的主要科技,在臨床診斷、藥物設計與開發與互聯醫療(Connected health)的潛力逐漸上升。其扮演的角色包含將病原進行分析與分類及預期治療後的結果、探討生化路徑與基因的調控,找出新的生物指示劑(Biomarker)與其標的、設計候選藥物,並預測其藥物動力與藥效之模式與對於實際臨床應用結果(Real world evidence)進行分析,增進對病患健康數據之利用,以幫助找出新的生物指示劑協助臨床診斷。

由於目前是大數據與體學(Omics)為主流的時代,人工智慧可以幫助我們找出錯綜複雜的數據關聯性,而將之應用於改良分析工具也使可我們進一步整合多面向的、異質性的大規模數據。配合次世代定序技術的快速發展與逐漸降低的基因體分析花費使得我們有越來越多數據可以被運用、各種體學的數據逐漸容易取得與基因型與表型的數據整合GWAS (Genome-wide association studies)與文獻中多面向的分析工具其需求日益增加,促使人工智慧技術的發展。也因為目前人工智慧奠基了數據導向、個人化的醫療方法,使得人工智慧也可以應用於疾病的發現與預後。

人工智慧起初被應用於放射學中,爾後是病理學,藉由機器學習的應用,與人工智慧將為基礎的電子視覺可在疾病生物學上提供分析並輔助診斷。近年來,人工智慧與機器學習的運算逐漸被應用在分子診斷,藉由深度學習處理龐大且複雜的基因組數據,可以更精準、更早發現疾病並改善傳統診斷。

二、 現階段發展趨勢

目前在分子診斷上遇到的挑戰包含檢測相較於其他臨床診斷複雜、需要集中檢測、缺乏統一的分析標準、大量檢測結果需要人工判讀、缺乏技術人才、決策複雜與缺乏用於進一步分析的生物指標等。而藉由人工智慧的整合,有助於其開發檢驗方法、減少結果產出的時間、免去集中化分析,且增加診斷的精準度。針對作業時間的方面,人工智慧可協助決定特定方法有效的生物標記並減少原先歷時數日的開發時間並減少研發過程中人為的失誤與限制。同時,也藉由在判讀診斷結果中整合大範圍的變數以做出更好的決策。至於精準度方面,人工智慧可被應用於找出病理學家之前沒有發現的癌症診斷與預後相關指標。結合人工智慧的預測與人為分析,達到比單純手動的判讀更高的精準度。最後,這種雲端為基礎的人工智慧分析,可以被無縫整合到基因檢測中,可使實驗室更有機會取得最先進的分析方法。

在分子診斷之預測、診斷、與預後能力部分,人工智慧已有許多擴增應用,首先是診斷部分,人工智慧與機器學習工具結合次世代定序與其他分子診斷的平台,可達到精準的分子數據分析、早期疾病偵測與找出人工判讀中被忽略的模式等。在預測診斷部分,人工智慧可以增強分子診斷預測疾病的發生率與早發性。這對於複雜的疾病如癌症、神經疾病等需要大量生物標記被分析的疾病尤為重要。至於臨床判斷支援(預後)部分,可做為中介治療的輔助工具,用於分析治療的反應並預測結果。這對於癌症或者傳染病,因如何達到適當的治療對這些疾病相當重要,而這仍是目前正在努力的目標。此外,機器學習與深度學習也用於藥理基因體學的研究,幫助未來個人化醫療的發展。

人工智慧在分子診斷中的應用:
1. 變異辨認(Variant Calling)
基於這些非編碼的變異,DNA與RNA結合蛋白與非編碼RNA的特性,大規模的分子數據組整合人工智慧可用於分類基因變異。
2. 變異分類 (Variant Classification)
藉由人工智慧的運算以分類編碼與非編碼的核糖核酸可以預測這些變異帶來的影響。對此,來自牛津大學、哈佛大學、麻省理工學院布洛德研究所(Broad Institute)的研究團隊已經開發出一種人工智慧的工具 EVE (Evolutionary model of variant effect)。這項工具利用一種非監督式機器學習(unsupervised machine learning)與演化數據以精準地分類病理變異。
3. 基因體註解 (Genome Annotation)
目前可以無血清培養液中生長之懸浮細胞株的發展將能改善擴展性、減少各批之間的變異性與減輕來自動物病原體的污染。
4. 基因型與表型的預測 (Genotype-Phenotype Prediction)
以基因組來預測的表現型特性:人工智慧運算的進步使我們可以處理大量且複雜的數據,並藉由基因的特徵預測複雜疾病的發生。人工智慧也對於表現型與基因型的對應上有所成果。

三、 主要應用現況說明

(一) 傳染病檢驗
目前應用於傳染病之診斷標準流程包含長時間的細胞與細菌培養、PCR、抗體檢驗等,由於整個流程的處理時間較長且缺乏精準性(由於進行檢測有可能會忽略掉一些新的基因變異、品系、潛在的物種且缺乏微生物抗性檢測),因此常導致不能快速精準地診斷出傳染病並提供治療。目前由於COVID-19的傳播加上隨著時間推移逐漸增加的抗微生物抗性,我們對於使用先進的次世代定序與總體基因體定序(Metagenomic-based diagnostics)進行之傳染病診斷、預測用藥反應與臨床結果之需求逐漸上升。藉由基因體診斷與人工智慧之整合可以幫助我們預測傳染病的流行、感染的預後並提供醫生可行的建議以開始合適的介入治療。此外,利用大數據與機器學習、人工智慧工具可將新冠肺炎患者藉由擴增的人工智慧分析生物標記分類,並作為有價值的臨床決策輔助工具。
在傳染病檢測中,人工智慧可以在抗生素管理、疾病的爆發監測與擴增、生物標記與傳染病的早期發現中提供輔助。抗生素管理部分,藉由運用人工智慧擴增的分子診斷,可以幫助分辨細菌感染與病毒感染,並開始合適的治療。同時,也可以精準地決定抗微生物抗性並將病患依照風險程度分類以達到抗生素管理。至於在疾病爆發監測部分可用於快速診斷與幫助抑制傳染病爆發以及預防傳染病傳播鏈。人工智慧也可擴增既有的生物標記如將在嚴重燒傷的病人中將急性腎損傷的病患從敗血症病患中偵測出來,抑或是在新冠肺炎中用來偵測預後的生物標記。最後,以人工智慧支持的傳染病診斷可以在症狀出現之前偵測出嚴重的感染,使得醫生可以實現早期治療並預防嚴重的併發症,如用人工智慧偵測出早期敗血症、病毒感染(PreV)等。

(二) 癌症診斷

由於液態生物檢體檢驗具非侵入性且處理時間短的特性,可大幅改善對於如癌症的診斷與胎兒出生前的檢測。然而,目前因缺乏精準地分析低循環腫瘤DNA的標準化、公正的方法使得推廣液態生物檢體檢驗推廣仍面臨許多困難。儘管如此,人工智慧在液態生物檢體檢驗的整合相對於其他分子診斷中的比例仍是最高的。因為伴隨著分子數據量逐漸增加,人工智慧輔助的診斷逐漸成為從循環腫瘤DNA中偵測疾病標記的有效工具,並瞭解個體中表現型與基因型的異質性,對於癌症的診斷提供極大幫助。大部分的次世代的液態生物檢體檢驗在工作流程中多整合了人工智慧科技(機率模型之產生與深度神經網絡),可用於整合、分析多峰性的診斷結果(如分子檢測、病理、放射學的數據)。目前已有超過20間分子診斷的公司在液態生物檢體檢驗中運用人工智慧與機器學習,並在過去幾年中,這些新創公司已經引起創投公司的注意。


(三) 精準醫療

由於近年來精準醫療與次世代定序的進步,病患的基因剖析(genomic profile)逐漸被用於預測風險、病人分類與標靶治療的發展。目前人工智慧進行的癌症、神經及心血管疾病的預測運算已經有著相當有不錯的成果,在預測疾病風險與治療成效中也有高精準度。而這個平台通常是藉由使用了上千個癌症的血液檢體所訓練出來的,使得他可以經由各種體學的平台辨認並學習各種癌症生物標記的規律與特徵,與其針對特定治療的反應。但是,目前只有少數的公司將人工智慧應用於他們對於精準醫療與個人化醫療的診斷流程,而主要應用人工智慧的領域為癌症與神經疾病。另外,在傳染病的應用方面,人工智慧與機器學習的工具可以藉由擴增感染症疾病的診斷預測傳染病爆發,實現早期診斷並提供對於可行的治療分析給醫生。目前主要應用的機器學習運算法包含Bayesian networks、 Random Forest與Fuzzy Clusters等。

四、焦點公司介紹

(一) GRAIL, Inc.
GalleriTM:針對50種不同的癌症的多種癌症早期篩檢套組

美國的GRAIL, Inc. 是一間專精於利用新技術來進行癌症的早期篩檢的醫療保健公司,融合了次世代定序、大規模群體的臨床研究、最先進的電腦科學和資料科學,開發了多種癌症的早期篩檢套組GalleriTM。

GalleriTM可以檢測50多種不同的癌症,包含乳癌、大腸癌、肺癌、攝護腺癌,以及子宮頸癌。其中約45種癌症仍缺乏建議的篩檢方式。此項檢測工具是利用機器學習運算偵測從腫瘤內釋放到血管中的游離DNA,與其DNA上的化學訊號,例如甲基化的模式,且偽陽率僅有0.5%。

近期,GalleriTM已經收到美國紐約州的核准。GRAIL也和英國國民保健署和英國政府合作,協助英國國民健保署針對早期癌症診斷的長期計畫。GRAIL的目標在於加速此款多癌症篩檢套組的進入市場與開始採用。他們確信採用此款套組後,會因更多癌症能被早期篩檢出來,而降低整體保健公共保健的開銷。

2021年8月,GRAIL Inc.被Illumina以將近80億元的價格收購。在此之前,此間公司充足自身的資金,進行了5輪募資,募集了將近20億元。

(二) Diagnostics.ai
PCR.ai:一個適用在各款聚合酶連鎖反應器執行各項分析的演算法

英國的Diagnostics.ai專注於開發能廣泛用於各種聚合酶連鎖反應器的人工智慧進行運算軟體PCR.ai。此軟體的目的是使即時聚合酶連鎖反應(Real-time polymerase chain reaction)的分析更具成本效益,並且縮短處理時間和降低人員的負擔。透過人工智慧和機器學習來加強即時聚合酶連鎖反應分析的精準度。此作法降低了感染方面的錯誤診斷與隨之而來的疾病擴散。因此,此項技術能夠助於降低整體的支出和經濟負擔。

PCR.ai結合了人工智慧的技術,能在多種檢測中偵測出即時聚合酶連鎖反應的結果。此項技術已有多個國際專利,且在英國、印度和美國的多間實驗室被採用。目前被用來進行多種呼吸道病毒和諾羅病毒的檢測。此款平台的特點在於不需要重新寫程式,就能夠簡單的應用於新的分析方法。此產品在自動分析、品管和產出報告方面具有以下優勢:可減少人為操作上的失誤、即時進行品管和排除錯誤遭遺漏的可能性、不需要專業人員額外分析曲線和閾值,且這項軟體的分析速度是專業技術人員的10倍。同時,PCR.ai可免去標準化和持續監控的需求,並產出能符合歐盟和美國的標準的報告。

(三) Sophia Genetics
SOPHIA DDMTM:針對以數據導向的醫療系統,以雲端運算為基礎的軟體即服務(software as-a-service)平台。

瑞士的SOPHiA GENETICS是一間醫療保健科技公司,致力於建立數據導向的醫療系統(data-driven medicine)。他們開發的雲端軟體即服務平台Sophia DDM,利用人工智慧的力量,提供一個安全、可靠且可即時存取的環境,來分析複雜的基因體學、影像組學與多峰性數據。此公司目前專注在五項領域: 腫瘤學、罕見的遺傳性疾病、心臟病學、神經學與代謝。

此外,這間公司發表了新的基因體檢測軟體SOPHA Clinical Exome Solution v3,此軟體可更有效的檢測出孟德爾遺傳疾病。配合探針捕捉的方式可以確保深入覆蓋目標區域,精準地找出基因變異,如:拷貝數變異、單核苷酸的變異、插入和刪除。此軟體也在增進了在檢測粒線體的基因體和280個基因位點的檢測能力。

在70個國家中,有超過780間公司是Sophia Genetics的客戶。藉由他們的人工智慧平台,Sophia成功地建立了世界上最大的數據驅動的數據導向醫療系統的網絡。Sophia Genetics計畫進一步的擴張,並在F輪募資中,從Major HealthTech Fund募集到了約1.1億美元的資金。甚至連銀行都參與了此輪募資。這些資金將被用於支持數據驅動的藥物開發日益增加的需求。

(四) Freenome
由人工智慧對液態生物檢體進行多體學(multiomics)的擴充檢驗,提供早期癌症的篩檢。

美國的Freenome是一間液態生物檢體檢驗的開發商,在機器學習、計算生物學和分子生物學上擁有深厚的專業知識。此公司開發了最先進的多體學檢驗平台,提供癌症的早期篩檢。此平台是透過血液篩檢來檢驗游離在血液中的DNA、RNA和蛋白質,因此稱作多體學平台。

此平台利用上千項癌症陽性檢體進行訓練,同時也利用正常的樣本進行標準化。因此,通過這種監督式學習的方式,此平台能夠學到特定種類的癌症所具有的生物標記模式,並能根據大量的訓練樣本資料集進行多項癌症的篩檢。此平台結合了游離DNA、甲基化和蛋白質的分析。此外,此平台也整合了腫瘤和非腫瘤相關的免疫生物標記。這使得它能夠在非常早期的階段篩檢出癌症。

先前,此平台用於檢測大腸癌,但目前也被用於進行胰臟癌的診斷。在診斷進行性腺瘤(advanced adenoma)方面,相較於美國食藥署核准的mSEPT9 (methylated septin 9)血液檢測僅具有22%的靈敏度,Freenom的多體學血液檢驗靈敏度高達41%。Freenome專注於開發簡易且精準的血液檢測以早期篩檢出癌症,也期許能夠結合他們和醫療衛生提供者的數據與分析。他們相信他們的目標能夠開啟機器學習在醫療衛生護理和科學之間的回饋迴路。

五、 結語

人工智慧為應用於現今健康照護裝置的重要科技,目前在需要藉助人工智慧協助醫療診斷上的課題有三,包含對於分子診斷普及化的需求、基因監測與人工智慧與大數據的收斂與多峰性數據的分析。

分子診斷由於缺乏可靠的分析工具進行基因的檢測分析,且受限於法規上不同國家的病患數據難以取得,希望可以開發出讓各國的實驗室都可以使用的軟體以提取出需要的數據,並提供現有的化學分析供參考,也希望可以讓一切人工智慧的工具都上雲端,幫助分子診斷的分析。目前C2i Genomics與Sophia Genetics目前都希望可以建立一個可擴增的軟體與分析工具,讓全世界的診斷中心都能一起使用,並達到居家基因檢測的目標。同時,Sophia Genetics也有與多間公司合作,希望可以展開一場數據導向醫療系統的革命,希望可以建立一個彈性、可客製化的人工智慧平台給不同的使用者(實驗室與醫院)。

在基因監測方面,人工智慧可以透過預測傳染病如Covid-19爆發,幫助減少病毒感染爆發,同時也可以幫助健康法規的團隊管理傳染病等,但是對此在國內與國際法規的推動速度仍非常緩慢。因為人工智慧某方面成功預測了covid-19的爆發,如BlueDot與Metabiota便在Covid-19在2019年底於中國爆發前便已預測了其發生。未來希望其他公司與公共衛生系統開發相關的人工智慧工具。另一方面,也希望可以藉由整合基因數據與其他數據如動物的疾病爆發數據,用以達到快速追蹤疾病爆發以及開發快速且精準的人工智慧輔助分子檢測可以幫助進行大規模診斷。

最後,隨著科技進展,我們現有的臨床診斷數據越來越豐富,但隨之而來面臨的是難以將這些資訊作有效且公正的解讀,因此對於人工智慧的應用需求逐漸上升。如多體學的分析成長導致大量異質性、多面向的數據產生,但是這些數據難以人工解讀,而機器學習可幫助精準分類大量複雜的數據並精準預測個人與群體的結果。因此許多公司專注於結合基因體學、蛋白質體學與其他來源以開發診斷工具,希望可以提供整合且最真實的的情況供後續分析。
許琪琳
英文