Google前中國研究院院長:用遷移學習輔助醫療診斷辨識,小數據也能訓練出精準ML模型

Google前中國研究院院長:用遷移學習輔助醫療診斷辨識,小數據也能訓練出精準ML模型 HTC健康醫療事業部總經理張智威在開發中耳炎辨識模型時,因為沒有足夠的數據,開始嘗試用遷移學習,將某個領域的知識轉移到另一個領域,提高模型準確率 文/何維涓 | 2017-11-09發表 HTC健康醫療事業部總經理張智威從在2006年就加入Google研究院,隨後還擔任了Google中國研究院院長,在人工智慧的領域已經投入多年,張智威已經回來台灣5~膠股力6年,但是因為較低調,鮮少人知道他其實已經回台灣一段時間。他指出,類神經網路從1980年代就誕生了,10年前就有一篇MoGo的論文,預測了電腦下圍棋會贏過人類,果真AlphaGo在今年初打敗人類世界圍棋冠軍,他認為,資料量的規模和運算能力的成長,是AI近來興起的關鍵。不過,雲端計算的能力在2008年就已經商業化,大數據也在2006年就開始興起,像是Google好幾年前就擁有龐大的數據庫,成為世界第一大的搜尋引擎,但是當時Google為何沒有用AI?他的答案是:「當時並沒有用AI的急迫性!」當時Google搜尋引擎的網頁評分系統和廣告推薦都並不需要用AI,就能提供給使用者的準確的結果,再加上,其實搜尋的結果和廣告推薦都沒有真實的數值(Ground Truth),因此,就連Google擁有豐富的數據和運算能力,也沒有採用深度學習的模型。現在,AI技術較成熟,他用一張實測的圖顯示,5種不同的演算法,針對不同資料量來訓練時,數據越多,演算法的準確率就越高,因此,他表示,如果數據夠多,就選擇便宜的演算法較佳,但若是數據不夠多,不管是多厲害的論文發表的演算法,其實效果都不彰。「大量資料是必要的,沒有資料就沒辦法做AI!」張智威直言,AI系統的準確度,仰賴訓練的資料量。他將眼光放向臺灣其中一項強項,那就是醫療,他認為醫療診斷需要更好的典範轉移,他舉例自己過去看診的過程,發現自己心臟不適後,到醫院掛號等待,終於輪到自己看診時,醫生卻只有5分鐘的時間可以看診,在5分鐘的時間內也無法確診,要另外安排其他的相關檢驗檢查,檢驗完畢後再回來看診,確診後醫生開藥給病患回家吃,來來回回就耗費了好幾天,如果下次又感受到身體不適,又得重複一樣的流程,他認為,醫療的診斷還可以有更有效率的流程。他指出,未來醫院不再需要集中在城市的某些地方,而是一個分散的系統,分散在一個地區的各地,讓民眾到達醫療機構變得方便,而醫院不再需要非常完整且精密的醫療儀器,而是一個病人與醫生的互動場所,因為許多病患的醫療資訊收集工作,可以在平時就完成。他舉出,應該要有設備能夠平時追蹤病患的健康狀態,將這些平時的資料存放在雲端,健康系統發現病患身體狀況可能有問題時,可以傳送警示給病患,建議病患到醫院檢查,而醫生也因為有更多足夠的數據,就能夠更容易確診病患的問題,病患的身體狀況也能得到更好的照顧。「臺灣的優勢是醫療,但是最後的關鍵還是需要數據!」張智威直言,沒有數據,預測系統是做不來的,他以HTC研究與健康醫療部門所開發的醫療診斷檢測設備來解說AI在醫療上的應用,醫療診斷檢測設備包含驗血驗尿診斷、呼吸診斷、光學診斷、生命特徵診斷,以及問診。驗血驗尿診斷可偵測糖尿病、貧血、肺炎、白細胞增多症和尿道感染,而呼吸診斷則是可以偵測阻塞性肺炎疾病,光學診斷能夠偵測中耳炎和黑色素瘤,生命特徵診斷即是心律不整、高血壓等疾病。他指出,醫生的問診就是縮減病患需要做的檢查和潛在症狀可能性的過程,透過最少的問題,定義出最準確的診斷猜測,現在有些網站提供病患自行搜尋症狀,系統經過分析後再給予使用者可能疾病結果,但是,他表示,這樣的使用者體驗不夠友善。張智威試想如何將AlphaGo成功的經驗,移轉到到醫療診斷系統上,他透過增強學習,讓代理人(Agent)詢問病患病症,根據病患回覆的病症給予病患預測的狀態,並用報酬的機制,答對給予獎勵,判斷錯誤或是問太問題就扣分,不斷的訓練。他比較了AI在圍棋與醫療診斷的差別,首先圍棋的棋譜可能性是有限的集合,而人類身體的狀況有無限種可能,再者,圍棋的輸出是二元結果,只有輸和贏兩種,但是人體的疾病大約有800種,最後圍棋可以出其不意,探索新的下棋法,但是醫療診斷必須遵循用藥指示,不能輕易嘗試新方法。有鑒於醫療診斷和圍棋的差異,張智威將人體用階層式分層,將身體的分成不同部分,主代理人選擇一個身體部分的代理人問診,需要考慮的包含病患醫療資料、身體的部位和疾病的好發時間,最後,達成大約7.24個問題,就可以完成問診。光學診斷的部分,他以中耳炎的判讀為例,用CNN 和DNN演算法辨識,但是因為訓練樣本不足,只有1,000多個圖像樣本,導致演算法的準確率大約只有75%,於是,團隊開始想辦法,在網路上找了各式各樣的影像,不是只局限於耳道的影像,並將這些網路上找來的圖片分類,透過CNN模型,將原本的圖片和處理後的圖片比對,當輸入一張圖片到CNN模型時,就會產生相對應的編號和辨識結果,像是中耳炎的圖片可能對應到柳丁或是拉花咖啡,他表示,這樣對應的關係,就是將某個領域的知識轉移到不同的領域上,也就是所謂的遷移學習,因此,透過這些與中耳炎無關的影像,最後辨識的模型稕確率高達90%以上。不過,他也認為,目前AI都還指示擅長辨識物件,AI只學習到了人腦的額葉(Frontal Lobe)運作,離真正的AI還很遠。他表示,現在很多企業都還在鼓勵年輕人開發App,但是他指出,現在App如果不收費,只靠廣告賺錢的話,至少要有15億的使用者下載App 才有辦法賺錢,而臺灣根本沒有這麼大的人口市場。臺灣的AI人才很多,重點是要有開發AI應用的動機,他也建議,網路上有許多開源的AI課程,有興趣往AI發展的開發人員都可以多多利用。

更多訊息更多資料都在這裡喔!~蚯蚓粉~地龍酵素~葉黃素~健康食品~青春元素~血栓溶解酵素~芙婷寶~磷蝦油~PPLS~南極冰洋磷蝦油~蝦青素~膠骨力~保健食品~地龍粉~蝦紅素~力雪達~蜂王漿~超視王~智勝王~蜂王乳~

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *