• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    醫療AI 正文
    發私信給李雨晨
    發送

    0

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    本文作者: 李雨晨 2020-11-30 10:37
    導語:這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗。

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    雷鋒網消息,日前,AI領域頂會EMNLP 2020落下帷幕。

    今年全球僅有754篇論文被接受,接收率為24%,阿里巴巴憑借28篇論文成為入選論文數最多的中國科技公司。

    據雷鋒網了解,阿里相關研究成果覆蓋情感分析、文本生成及醫療NLP等領域。

    在今年疫情的大環境下,醫療領域的研究與成果產出也不斷提速。

    在名為《Predicting Clinical Trial Results by Implicit Evidence Integration》的論文中,達摩院研究團隊設計了針對醫學臨床試驗的進一步預訓練任務,并提出全新的模型,幫助醫學研究工作者更好地選擇醫學臨床試驗,以更快地找到有效的治療方案。

    研究團隊在COVID-evidence數據集上完成了試驗,并證明了模型的有效性。

    論文鏈接:https://www.aclweb.org/anthology/2020.emnlp-main.114/

    為此,該論文作者、達摩院算法專家譚傳奇進行了解讀。

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    自18年谷歌BERT橫空出世以來,預訓練語言模型一躍成為自然語言處理領域的研究熱點,“Pre-training + Fine-tune”也成為NLP任務的新范式,將自然語言處理由原來的手工調參、依靠機器學習專家的階段,進入到可以大規模、可復制的大工業施展的階段。

    這篇論文在BioBERT(在醫學數據上訓練的BERT模型)的基礎上,設計了針對醫學臨床試驗的進一步預訓練任務(Post-Pre-training),最終在真實醫學臨床試驗數據上微調(Fine-tune)后,取得了超過10個百分點的結果提升。

    而這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗,特別在COVID-19疫情下,更好的醫學臨床試驗或許就意味著能更快地找到有效的治療方案。

    劍指臨床試驗的設計難題

    在循證醫學的時代,任何的治療都要有相應的臨床證據支持。證據往往來自于高質量的臨床試驗。然而,實施臨床試驗耗時耗力,需要大量資源支持。

    并且,設計有缺陷或者難以成功的臨床試驗占用了寶貴的病人資源,可能會使亟待實施的臨床試驗因招募不到足夠的患者而被迫終止。

    新冠肺炎疫情中的瑞德西韋臨床試驗就是一個例子:

    因其他設計有缺陷或者難以成功的臨床試驗占用了不少病人資源,該試驗沒有招募到足夠的病人資源,而沒有得到統計學上顯著的結果。

    所以,研究者需要在設計階段就去預測臨床試驗的結果,并優先進行成功概率較高的臨床試驗。

    提出新的臨床試驗需要過往臨床證據的支持,比如WHO為新冠肺炎推薦優先檢測氯喹/羥氯喹,瑞德西韋,干擾素和洛匹那韋/利托那韋四種藥物優先進行臨床試驗。

    推薦的理由就是,這些藥物在過往的實驗室或人體試驗中對相關冠狀病毒有效。然而,人類綜合過往臨床證據的能力有限。

    譚傳奇引用了一個數據:一項研究發現大概86.2%的臨床試驗最終會失敗,WHO專家推薦的某些新冠肺炎治療方法,如氯喹/羥氯喹,也沒有得到好的結果。

    臨床試驗設計難題的核心是臨床試驗的結果無法準確預測。

    所以,如果能準確地預測臨床試驗的結果,就可以有針對性地進行成功概率的臨床試驗,從而大大提高臨床試驗實施的效率。

    因此,譚傳奇團隊表示,在本工作中,我們的貢獻就在于:

    第一、創新地從NLP的角度重新定義了臨床試驗結果預測任務;

    第二、提出了一種基于大規模隱式臨床證據預訓練的模型EBM-Net(Evidence-Based Medicine Network)用以解決該任務,EBM-Net在各種指標上遠超醫學大規模語言模型BioBERT,如在標準數據集上有10.7%的相對F1提升,并且在新冠肺炎相關的臨床試驗上也被證明有效。

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    在上面這張圖中,參考醫學臨床試驗在填報提案時需要的基本信息,輸入是自然文本的形式的:

    臨床試驗背景B,如“最新研究發現瑞德西韋在體外對新冠肺炎病毒有效……”;

    要研究的人群P,如“重癥新冠肺炎病人”;

    治療方法I,如“靜脈注射瑞德西韋”;

    對照方法C,如“與瑞德西韋相匹配的安慰劑”;

    測量指標O,如“死亡率”

    輸出是其結果R,即在研究人群P中,治療組I和對照組C的測量結果O的比較關系,有升高、降低和不變三種。

    EBM-Net

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    為了解決上述臨床試驗結果預測任務,達摩院的團隊提出了針對循證醫學的EBM-Net模型,其結構如圖2所示,具體分為三步進行:

    首先,用啟發式方法收集隱式證據;

    然后,用隱式證據預訓練比較語言模型;

    最后,用預訓練的模型進行臨床試驗結果預測。

    收集隱式證據

    臨床證據常常以一種比較的形式表達,如“瑞德西韋比對照組有更好的治療新冠肺炎的療效”,而找到這些證據就可以為我們提供訓練文本。

    研究團隊發現,PubMed和PubMed Central是一個提供生物醫學方面的論文搜尋以及摘要,文獻資源中就包含需要的證據文本(注:醫學領域最好的大規模語言模型BioBERT的訓練數據即來自PubMed)。

    這篇論文提出用關鍵詞匹配的方法,收集PubMed和PubMed Central中所有含有比較語義的句子:

    為尋找表達升高和降低的語義,匹配含有“than”的句子,再進一步匹配形容詞或副詞的比較級,如“higher”,“smaller”等,同時含有“than”和一個或更多比較級的句子被收集;為尋找表達相似的語義,匹配含有“no difference between”和“similar to”模式的句子。

    這些句子被稱為隱式證據,因為它們往往隱式地含有臨床證據所需要的PICO組分。他們還收集這些句子對應的文章摘要里的背景和方法的部分,作為隱式證據的背景B。

    這種方法可以從PubMed和PubMed Central中提取出1180萬條隱式證據,其中240萬條表達結果降低,350萬條表達結果相似,590萬條表達結果升高。

    預訓練比較語言模型

    將收集到的隱式證據中提示結果語義的詞去除,就構造了一個類似語言模型訓練的問題,通過給定上下文信息,預測去除的比較詞。

    論文中改進語言模型,提出用比較語言模型預訓練一個Transformer編碼器模型,即EBM-Net,以獲取預測臨床試驗結果的能力。具體地,兩組樣本被用于預訓練:

    1、用正序的隱式證據預測其結果;

    2、用反序的隱式證據預測相反的結果。

    加入反序的例子有利于模型學到治療組和對照組之間的比較,而不是語言模型里的共現關系。

    臨床試驗結果預測

    在微調和測試時,團隊將一個新臨床試驗要研究的PICO要素拼接成E,將E和其研究背景B輸入到上述預訓練好的EBM-Net模型中,輸出其預測的比較結果,從而預測臨床試驗的結果。

    標準數據集的試驗結果

    EBM-Net在臨床試驗結果預測任務的標準數據集Evidence Integration試驗結果如圖3所示:

    劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

    從結果中可以看出:

    1、EBM-Net相比其他方法,包括隨機預測、詞袋+邏輯回歸、利用MeSH知識圖譜、信息檢索+閱讀理解模型以及目前生物醫學NLP領域的SOTA模型BioBERT,都有很大的提高:BioBERT作為最強的基線模型,也比EBM-Net低了10.7%的相對macro-F1和9.6%的準確率;

    2、EBM-Net相比其他方法在對抗攻擊下更魯棒:用|Δ||Δ|,即在對抗數據集上的accuracy的相對減少的值來衡量模型的魯棒性,|Δ||Δ|越大表示模型越易受攻擊。

    BioBERT的|Δ||Δ|幾乎是EBM-Net的兩倍(5.1%比2.7%),說明EBM-Net遠比BioBERT魯棒;

    EBM-Net用于新冠肺炎相關臨床試驗

    達摩院團隊還基于COVID-evidence數據庫提取了截止5月12日前完成的22篇臨床試驗的結果,以本工作定義的臨床試驗結果預測的格式構建了一個小型數據集。

    達摩院團隊提出的EBM-Net模型在該數據集上進行留一法驗證得到的macro-F1和accuracy都遠高于BioBERT,分別是45.5%比36.1%和59.1%比50.0%,再一次驗證了EBM-Net的有效性。

    總結

    為了優化臨床試驗的設計過程,本文從NLP的角度定義了臨床試驗結果預測任務,并且提出了一種基于大規模隱式證據預訓練的EBM-Net模型來解決這個任務。

    EBM-Net在標準數據集和新冠肺炎相關臨床試驗上都有較好的表現,大幅超過生物醫學NLP的SOTA模型BioBERT。

    未來,臨床試驗可以在EBM-Net等相關模型的協助下進行設計:

    當我們固定了想要研究的疾病人群(P)和觀察指標(O)后,可以固定以現有的標準治療為對照(C),遍歷每種可能的新型治療方式(I)以及其相關的背景介紹(B),用模型預測其成功的概率,優先選取所有可能的治療方式中成功概率高的做臨床試驗。

    當然,模型在技術上還需要進一步地提高才能更好地輔助臨床試驗設計。后續,我們可以把團隊構建的大規模醫學知識圖譜集成在模型中,使其擁有更準確和魯棒的預測能力。雷鋒網

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章

    新智駕主編

    專注蔚小理等造車新勢力的原創報道 |微信:Gru1993
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 东京热一区二区无码av| 亚洲人妻有码高清| 国内精品久久久久影院网站| 国产在线拍揄自揄视频网试看 | 国产免费久久久久久无码| 成人片黄网站a毛片免费| 铁牛TV尤物| 国产丝袜熟女一区二区在线| 欧美自拍另类欧美综合图区| 亚洲一区自拍高清亚洲精品| 露脸国产精品自产拍在线观看| 又爽又大又黄a级毛片在线视频| 精品久久精品久久精品九九| 国产午夜福利视频合集| 欧美熟妇精品一区二区三区| 四虎影视一区二区精品| 麻豆国产成人AV在线播放| 亚洲色吧AV| 无码AV在线播放| 亚洲高潮喷水无码AV电影| 无码欧美日韩二区三区蜜桃| 亚洲精品成人a在线观看| 五月天天天综合精品无码| 国内成人综合| 日韩熟妇无套内射视频| 国产午夜精品久久精品电影| 国产极品粉嫩尤物一线天| 超碰人人艹豆花| 一区二区三区无码视频免费福利| a毛片久久免费观看| 国产精品一二三中文字幕| 日本丰满少妇裸体自慰| 97超碰中文字幕久久精品| 国产欧美日韩高清在线不卡| 草莓AV| caoporm国产人妻| 精品少妇人妻一区二区| 国产极品美女高潮抽搐免费网站 | 久久不见久久见免费视频观看| 国产成人午夜福利精品| 一区一区三区产品乱码|