0
近日,雷峰網《醫健AI掘金志》以《隱私計算,讓AI釋放醫療數據的價值》為話題,邀請了四位隱私計算企業CXO,以線上云峰會的形式,討論隱私計算的技術路線和在醫療場景下的實際應用前景,以及推演該產業的未來趨勢。
感興趣的讀者,可以點擊公眾號的【云峰會】菜單欄,觀看4期嘉賓的視頻回放。
作為本次云峰會的最后一位演講嘉賓,翼方健數合伙人、醫療健康事業群總裁李葦剛,進行了題為《隱私安全計算和人工智能如何在大數據時代推動醫療行業數字化轉型》的演講。
他圍繞醫療行業的數字化轉型中,如何通過包括隱私安全計算在內的全棧技術,打造數據在全流程安全計算環境下的價值利用和價值共享等內容進行了分享。

數據是智能時代最活躍的生產要素,李葦剛表示,“數據價值體現的終極形式是數據資產化,而數據資產化的實現,必須依賴具有隱私安全計算能力平臺所提供的完整流程能力,包括從數據匯集、治理、確權、授權、到數據應用、定價、交易、以及數據價值的溯源和分配等。”
以下為李葦剛的分享內容,雷峰網(公眾號:雷峰網)&《醫健AI掘金志》作了不改變原意的編輯及整理。
國家衛健委衛生發展研究數據中心游茂主任曾提及,“目前我國醫療服務發展正處于從信息化向數字化過渡的關鍵階段”。
大家經常討論的數字化轉型分為兩個內容,一是業務數字化,一是數字業務化。
從翼方健數的角度理解,業務數字化是整個數字化轉型的上半場,也就是大家熟悉的信息時代通過信息化的系統來優化和改造業務流程。
而作為下半場的數字業務化,即在智能時代通過數據推動新興業務的發展,通過數據尋找和創造更多更好解決問題的思路和方法。
數字化轉型上半場將持續進行,當前的重點則是在下半場如何以數據優先,產生新的數據業務,開創新的數據經濟。

比擬于過去的農業時代和工業時代,智能時代的數據就像從前的土地和資本,在當今時代為一個行業、一個地區、一個國家、一個社會創造難以預計的價值。
2020年中共中央、國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》中,將數據納入進行市場化配置的重要生產要素。

作為信息時代的副產物,數據往往存在質量參差不齊、非標準化、非結構化以及數據之間相互隔離等問題。
如果我們將數據與資本、土地、人才、知識等生產要素進行比較,就會發現它最具代表性的特征是非競爭性和非排他性。
非競爭性與非排他性是指同樣的數據可以同時在不同的場景下被反復使用,而一般的要素,當在一個場景中使用時,在很長一段時間將無法在其他場景下被使用。
這是一把雙刃劍,一方面數據的價值沒有天花板,但另一方面如果數據被人拿走,不論采用什么方法,通過什么渠道,拿走數據的人都將和數據所有者一樣擁有對數據的使用權,擁有對數據價值的分配權,從而影響數據所有者手中數據的價值。
再加上醫療數據本身所包含的隱私、機密信息,就導致我們對于醫療數據的使用非常的小心和謹慎。
將數據作為一個新的生產要素發揮價值,就需要在很多場景中開放地使用;但使用過程中,又面臨著數據安全問題。這個矛盾如何解決?
首先要分清一個概念:原始數據和數據價值是兩個不同的東西。
第二個要分清楚的概念是:數據的所有權和使用權不同,二者可以分離。
當我們將原始數據和數據價值分開,將數據所有權和使用權分開,也就為利用隱私安全計算解決數據安全和數據流通之間的矛盾提供了一種可能性。
將數據作為一個新的生產要素使用時,需要解決數據安全和數據價值流通二者間的矛盾,隱私安全計算技術就是解決這個矛盾的靈丹妙藥。
隱私安全計算強調不分享原始數據,只分享數據的價值。即提供一個環境,在這個環境中通過計算數據獲取想要的結果,也就是數據的價值。
整個計算過程始終保證原始數據的安全,保證使用者獲取數據的價值。

隱私安全計算領域包含很多技術,既有大家耳熟能詳的區塊鏈、云計算,也有最近云峰會中被反復提及的多方安全計算、同態加密、聯邦學習、安全沙箱、可信環境等。
這些都是隱私安全計算中的核心技術,使用這些技術手段能夠保證數據在計算和使用過程中的安全。

了解隱私數據平臺,首先要了解醫療信息化歷程。
從信息時代到數字時代再到智能時代,醫療信息化不斷演變。從院內信息互聯互通到建設數據中心,再到互聯網醫療線上線下打通和阿里提出的數據中臺概念,醫療信息化進程經歷了基礎階段、完善階段和應用階段。
如今我們提出“隱私數據平臺”的新概念,是在中臺的基礎上加入隱私安全計算的技術,使數據中臺里的數據能從原始狀態轉變為數據資產,實現更好更安全地管理、使用與價值共享。

何為隱私數據平臺?
隱私安全計算技術只是其中一部分核心技術,隱私數據平臺是一個系統工程。
在這個系統工程中,首先要保證的是全流程的通暢。從數據的匯集到數據的治理,以及歸一、結構化、標準化等。
數據匯集后,還要對數據做最小單元的管理、確權。只有完成確權后,才能在需要做數據授權使用時,知道找誰去授權,誰有權利進行授權。
然后是使用數據,從數據的查詢、探測開始,找到想要的數據,并向相關數據擁有管理權限的管理方,申請授權后才能開始使用數據。
在使用數據時,還需要引入自己的解決方案,或是借用第三方的服務或應用工具進行數據計算,當所有的計算在安全環境中完成后,即可得到想要的結果,也就是數據的價值。
最后的工作是考慮如何下載計算結果,如何分配數據價值,以及對前面工作做出貢獻的參與方如何分配利益。
以上工作全部完成后才是一個完整的隱私數據平臺。

數據價值分享的第一步就是數據治理。
翼方健數具有自己的數據治理平臺DATAWAND,能夠對數據進行清洗,將各系統提供的原始數據轉換為可供使用的數據資源。
經過數據治理后,我們就有了可供使用的數據資產,之后就是數據共享環節。做數據共享時,要遵循FAIR原則,即可發現、可訪問、可互操作和可重用。

翼方健數目前最核心是圍繞XDP平臺的相關產品,包括醫院使用的科研平臺、藥廠使用的藥研平臺、保險公司使用的醫保平臺以及用于公共衛生領域的疾控平臺。
我們在醫院端也有一些AI應用,即智慧病案管理的系列解決方案,包括智能分級診療、智能哨點、輔助書寫、輔助決策、病歷質控、首頁質控、DRG/DIP費控等一系列的醫院院端應用解決方案。
最后,我們也在隱私安全計算保護的前提下,為保險公司、藥廠等提供數據使用的服務。

我們的理念是用技術解鎖數據的價值。將數據從原始狀態通過隱私安全計算、數據治理、建模、應用等一系列的技術和工具進行加工,轉化為數據價值,再回饋到應用中去,形成從原始數據到數據價值再到數據資產的閉環,在閉環當中反復使用。
只有醫療隱私計算技術是無法真正發揮數據的價值,必須具備全棧的技術,多方合作一起完成閉環,推動數據價值的流動。
接下來為大家介紹我們實施完成的三個醫院案例與兩個區域案例:
第一個醫院案例是瑞金醫院自主學習型智能化電子病歷。
我們利用在瑞金醫院通過隱私安全計算拿到的數據進行建模后,再通過模型引導電子病歷的智能書寫。
目前,已經完成了門診和住院的兩個科室的落地和應用,平均病歷書寫時間縮短了70%,正在推廣全院的門診、急診電子病歷書寫的智能輔助。
第二個醫院案例是上海九院全息全病例智能內涵質控。
我們與九院合作,通過對病歷數據按病種分類,并按各科室進行數據建模,采用深度學習人工智能技術進行病歷數據質量校驗和內涵質控,有效保證病歷質量。
系統可參照知識庫中質控規則以及診療路徑中前后文書的涵義做出對比,找出其中不符合規則或前后不一致的地方,在秒級內給出建議并提示,實現近實時的、自動化的、從事中到終末的門急診、住院數據質量控制體系。
第三個醫院案例是翼方健數與中山大學腫瘤防治中心胡丹旦教授合作的項目。
我們在院內搭建了科研大數據平臺,將基因影像、文本病歷等多模態的數據融合,建立一個專科專病庫。
項目應用了通過隱私安全計算融合來源于不同渠道的數據源的數據。
第一個區域案例是長三角生物醫學產業大數據聯盟。
該項目是由中科院營養所牽頭,翼方健數與上海生物信息學會、福建省生物信息學學會等單位聯合組建的大數據聯盟。
大數據聯盟中使用了翼方健數的平臺,通過技術將長三角不同醫院、不同學校的數據匯集在平臺上,由數據提供方管理數據的授權與使用,構建生物醫學產業全新的數據協作共享生態。
第二個區域案例是我們剛剛完成的宜昌市多點觸發疾控大數據平臺。
該項目包括兩個平臺,一個是宜昌市衛健委的醫療數據隱私安全計算平臺,另一個是宜昌市大數據中心的政務數據隱私安全計算平臺。
我們利用隱私安全計算將兩個平臺之間的數據通過授權共享,而非傳統的原始數據互聯互通。
此外,該項目不僅完成了政府和政府數據之間連通,也做到了政企數據的融合。
政企數據融合是近年來非常熱門的話題,政府想要用企業的數據,企業也想用政府的數據,但是因為種種原因無法實現。
在這個案例中,我們利用隱私安全計算技術實現了宜昌市兩個政府平臺與外部兩個企業的數據的聯通使用。
在結束之前,我們用兩個問題總結一下今天的內容。
第一個問題是你的數據能用嗎?
這個問題有兩個內涵,一方面是指數據是否是可用的狀態,如果不可用,則可以通過數據匯集治理后實現。
另一方面是指治理好的數據是否敢用,如果沒有隱私安全計算的保護,無法充分保證數據在使用過程中的安全,大多數人都無法放心地使用數據,所以我們希望通過一系列的技術解鎖醫療數據的價值,將醫療數據用起來。
第二個問題是你的數據用了嗎?
當我們擁有可用、敢用的數據后,應該將數據用在什么地方呢?可以自己使用,可以和同行共享,也可以跨區域、跨平臺、跨行業使用。
在隱私安全計算的保障下,我們期待共同探討數據使用的途徑,尋找更多的合作伙伴,一起將數據用起來,讓醫療數據為人民服務。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。