亚洲av成人无码网天堂,少妇白浆高潮无码免费区,小污女小欲女导航,色欲久久综合亚洲精品蜜桃,亚洲,欧美,日韩,综合

侵權投訴
訂閱
糾錯
加入自媒體

NVIDIA Clara 能讓醫(yī)療AI開發(fā)變得有多容易?

2020-04-03 16:07
動脈網
關注

2003年,當一種冠狀病毒引發(fā)的非典疫情席卷亞洲時,互聯網尚處于萌芽期,互聯網在醫(yī)療場景中還沒有落地,人們僅能前往醫(yī)院等待治療。那時,影像科總是人潮涌動,很多患者因為在醫(yī)院聚集而遭受感染。

今年,一種新的冠狀病毒帶著更強的傳染性席卷全球,但中國僅花費不到兩個月,便控制住了病毒在湖北以外地區(qū)的傳播。在AI的幫助,疫區(qū)影像科的診斷效率迅速上升,患者聚集情況大幅改善;新藥研發(fā)公司也通過創(chuàng)新的基因分析手段探索病毒的RNA結構,短短數日便能篩選出1000多個RNA聚合酶核苷類抑制劑化合物的可編輯結構化數據。

正如我們在疫情之中觀察到的,人工智能輔助診斷、基因分析等技術正因為其廣袤的前景而吸引著越多越多的研究人員進入其中,但由于行業(yè)自身的高門檻,許多擁有豐富經驗的醫(yī)生、學者難免在研究路上受挫。

如今,為了讓更多的開發(fā)者能夠體驗到NVIDIA的算力支持,并以更加簡單的方式對數據進行編輯,NVIDIA在EGX、DGX、云計算服務之上開發(fā)了Clara框架,為研究人員提供聯邦學習、遷移學習等服務,通過降低數據門檻的方式,推動研究人員把重心回歸研究本身。

什么是Clara

NVIDIA正式發(fā)布Clara平臺是在2018年的RSNA之上,那時NVIDIA的目的僅是為影像學AI研究者提供一個醫(yī)學影像的軟件開發(fā)工具,以標準化影像數據,并提升AI訓練速度。

隨后,NVIDIA的開發(fā)者發(fā)現,基因組是一個更為龐大的數據源,要處理億級的堿基配對,必須找到更理想的算力來源,才能保證試驗在成本上可行。在2019年蘇州舉辦的GTC大會之上,基因組學已經成為Clara要啃掉的另一塊蛋糕。

到了今天,NVIDIA Clara的定位于面向醫(yī)療開發(fā)者的智能計算軟件平臺。接下來,所有醫(yī)療行業(yè)的解決方案都會整合進Clara,NVIDIA意欲打造一個全能的“醫(yī)療百寶袋”,為更想要探索醫(yī)療領域的開拓者提供高效便捷的數據分析工具。

截屏2020-04-02 下午5.42.08.png

NVIDIA Clara

從整體上看,NVIDIA Clara包含了GPU加速庫、3個SDK以及一系列參考應用。在這一階段下,Clara能夠為科研工作者提供的服務主要聚集于醫(yī)學影像領域與基因分析領域,而這兩個領域,正因為大數據的浪潮而飛速發(fā)展。

醫(yī)學影像應用:用AI幫助開發(fā)者標注3D影像

在醫(yī)學影像中,如果一個醫(yī)院或者一個企業(yè)想利用 AI技術構建一個深度學習算法,并將其投入使用,那么需要完成4個步驟的工作。

數據是構建AI的第一步,在獲得原始數據后,研究人員首先需要對數據進行特定的標注,如標注出肺部CT影像中的結節(jié)部分。要構建一個運行優(yōu)異的AI算法,這一步操作至關重要。

有了標注數據后,研究人員便需要將數據導入到選定的AI模型中,開發(fā)適合于研究人員需求的深度學習算法。從國內的情況而言,很多研究人員通常是使用開源算法進行二次開發(fā),或是借助于其他領域表現良好的算法進行遷移。

第三步是通過測試集對已有的算法進行檢驗。研究人員需要把AI模型放到實際之中,觀察AI的實際運行情況,如果算法不能很好滿足測試集的要求,研究人員可能就需要修改算法參數,重新開始訓練。

當研究人員獲得測試表現良好的算法后,便可以嘗試將其部署于設備端,在真實的醫(yī)療診斷環(huán)境中進行推理工作。到此為止,AI的開發(fā)工作便已基本完成。

NVIDIA開發(fā)Clara AI應用平臺的目的就是為了讓上述的四個步驟標準化、簡單化,讓研究人員可以更加專注于醫(yī)學本身的研究。

以數據標注為例,這一工作本是一件體力活,是“人工”跨向“智能”不可避免的重復性工作,而醫(yī)生不可能將太多的時間花在像素點連線之上。所以,一般AI企業(yè)選擇從醫(yī)院尋找剛畢業(yè)的研究生進行勾畫,其成本在每組數據20-30元,實習生處理一組低層數據通常需要20-40分鐘,若要使勾畫更精細,則需花費1-2小時的時間。

這種數據獲取方式存在兩個重要的問題,一是人工智能訓練需要的數據量大,企業(yè)很難找到足夠多的實習生進行勾畫,成本也非常高昂;其次,影像的勾畫通常對工作人員的資歷要求較為嚴格,實習生常常會出現結節(jié)遺漏、標注錯誤等現象。

從這一需求出發(fā),NVIDIA在Clara Train SDK中植入了深度學習輔助標注的組件AI Annotation Server,開發(fā)者可直接使用這一組件對醫(yī)學影像進行標注。

NVIDIA的實驗數據顯示,應用這一工具包后,單個肺結節(jié)的標注時間可降至8-15分鐘,醫(yī)生的標注效率可提升4-8倍。此外,通過粗略計算,胰腺的標注速度可提升4倍,脾的標注速度可以提升10倍。

此外,在DGX的加速下,NVIDIA可以將數周才能完成的計算任務提速至數小時,這將大幅降低醫(yī)療AI企業(yè)的試錯成本,企業(yè)甚至可以同步開展多個算法測試。人工智能的產出,甚至是發(fā)展,都會因此大大提速。

醫(yī)學影像應用:用聯邦學習破除AI模型魯棒性難題

即便是我們解決了AI開發(fā)中的難題,并不代表就能讓AI走向實用。在上述的步驟之中,我們忽略了醫(yī)學領域數據的一個重要特征——安全性。由于醫(yī)學數據與生命信息息息相關,只有在保證數據安全的前提下,我們才能談及數據的應用。

這意味著,企業(yè)或醫(yī)生在訓練AI時,不能把數據帶出醫(yī)院,而成熟的AI算法,通常需要克服地域差異,進行多中心的試驗。如果AI模型不具備魯棒性,就失去了應用與臨床的價值。

雖然數據不能出院,但是模型可以,那么我們能否直接將模型融合起來呢?答案是可以的。聯邦學習便是多個參與單位用各自數據訓練完成的模型進行聚合,以實現數據不出院的情況下多個模型的統一,最終實現AI模型的高魯棒性。

截屏2020-04-02 下午5.42.22.png

聯邦學習與中心訓練結果對比

通過一個包含13個用戶組的融合實驗,NVIDIA得到了上圖結果。圖中的紅線是以數據中心模式進行訓練得到的模型精度曲線變化情況,綠線是聯邦學習下,13個模型融合后的模型精度曲線變化情況,可以發(fā)現隨著訓練迭代次數的增加,兩條曲線高度重合,這個實驗一定程度上證明了聯邦學習的可用性。

NVIDIA工程師在GTC2019講解聯邦學習

不過,新的問題也在不斷出現。如果各個模型差異很大,那么聯邦學習如何自行“去粗取精”呢?“增量學習”將是NVIDIA下一步研究的重點。

除了Clara Train SDK,NVIDIA還開發(fā)了Clara Deploy SDK,用于優(yōu)化PACS已有的工作流。同時,利用Clara Deploy SDK,醫(yī)生可以在臨床環(huán)境中靈活快速部署醫(yī)療影像AI模型。

基因組學:數據分析與AI構造

再談NVIDIA新近瞄準的基因組學。2003年首次對人類基因組進行測序以來,整個基因組測序的成本就一直在下降,而且下降的速度遠快于根據摩爾定律所預測的速度。從新生兒基因組測序到開展全國人口基因組計劃,該領域正在蓬勃發(fā)展,并且日趨個體化。

測序技術的進步引發(fā)了基因組數據的爆炸式增長。序列數據總量每七個月增加一倍。這一驚人的速度可能會使得到2025年基因組學產生的數據量比其他大數據源(例如天文學、Twitter和 YouTube)數據量總和的10倍還多。

各種新的測序系統,比如全球最大的基因組學研究集團——華大集團的DNBSEQ-T7等正在推動這項技術的廣泛應用。該系統每天可以生成高達60個基因組,產出高質量數據1-6 Tb。

憑借華大集團的流動池技術的發(fā)展以及一對NVIDIA V100 Tensor Core GPU所提供的加速,DNBSEQ-T7的測序速度提高了50倍,令其成為迄今為止吞吐量最高的基因組測序儀。

但測序的加速工作遠沒有結束,科學家在觀察更加微觀的世界時提出了新的需求。為了滿足這樣的需求,NVIDIA也在不斷探索。

為了通過加速和智能計算解決基因組測序和分析日益增長的規(guī)模和復雜性,NVIDIA創(chuàng)造了Clara Genomics。

通過Clara框架下的Clara Genomics Analysis SDK,研究人員可以加快基因數據的讀取、序列對比,以降低分析成本,提升數據質量。

截屏2020-04-02 下午5.42.33.png

Clara Genomics

此外,NVIDIA還收購了Parabricks,這是一個CUDA加速的基因數據分析工具包,可用于發(fā)現變異,并能產生與行業(yè)標準GATK最佳實踐流程一致的結果。運用這個工具包,相關計算可提升30-50倍,并可利用深度學習進行基因變異檢測。

截屏2020-04-02 下午5.44.34.png

NVIDIA Parabricks GPU加速的GATK

通過與華大集團合作,Parabricks的軟件可以在一小時內完成全基因組的分析。華大集團使用一臺內置8個NVIDIA T4 Tensor Core GPU的服務器,證明了可以通過提高吞吐量將基因組測序成本降至2美元,這還不到現有系統成本的一半。

NVIDIA 為 COVID-19 研究人員免費提供 Parabricks,了解更多請點擊此處。

AI的未來需要所有人共同開創(chuàng)

隨著深度學習進入越來越多的領域之中,NVIDIA在為眾多開發(fā)者提供算力支持的同時,也為其搭好了強有力的“基底”,在這之上,開發(fā)者能夠將更多的精力放在知識的探索之上,而非受制于如何使用數據分析工具。

如今,Clara已經擁有了眾多的合作伙伴,在中國,聯影醫(yī)療、安德醫(yī)智均采用了這一平臺進行合作開發(fā),在海外,賽默飛世爾、佳能Vital、約翰霍普金斯大學也與NVIDIA建立了深入的合作關系。


聲明: 本文系OFweek根據授權轉載自其它媒體或授權刊載,目的在于信息傳遞,并不代表本站贊同其觀點和對其真實性負責,如有新聞稿件和圖片作品的內容、版權以及其它問題的,請聯系我們。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號