伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

本文作者：王金許

2017-08-18 14:08

導語：怎么樣讓機器能夠永遠一直學下去？

雷鋒網按：隨著 DARPA（美國國防高級研究計劃局）的項目 L2M（終身學習機器）和歐盟聯合項目 LLIS（智能系統的終身學習）出現，LML（終身機器學習）開始備受關注。研究者們意識到在一種數據集中運行一種機器算法的傳統機器學習范例遠遠不能達到真正意義上的智能，它只適用于狹窄的領域。人類自身的學習過程則與之截然不同。我們在開放環境中能夠持續學習，積累學習到的知識，并用于未來的學習和解決問題當中。

LML 旨在達到這些能力。在 NLP 中，聊天機器人等具有語言能力的機器人越來越被廣泛使用。對這些系統而言，在開放的世界中與人類和其他機器人的互動中不斷學習，能夠實現更好地聊天是夢寐以求的。在這次演講中，劉兵教授將主要講述這種模式轉變，關于 NLP 進入下一層級的最新研究以及 LML 所面臨的挑戰。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

劉兵，伊利諾伊芝加哥分校教授，ACM、AAAI、IEEE Fellow，主要研究領域有終身機器學習、情感分析、數據挖掘、機器學習和自然語言處理。

以下為劉兵教授在第二屆語言與智能高峰論壇的演講，雷鋒網做了不改變原意的刪減。

我今天想講的是我這幾年做的一個事情，是講怎么樣讓機器能夠永遠一直學下去，而不是說像現在這種還是一個一個的去學。

我的應用主要還是在自然語言方面比較多一些。為什么我們做機器學習的人，還是在做一個 Isolated Single-task Learning（單任務學習），它不考慮別的事情。如果我們要用圖來表示，先來 Task T，然后來一個 Data T，通過機器學習算法算出一個 Model，它拿來直接用就是 Application。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

但是這個有什么問題呢？它不考慮其他與之相關的事情，而且不考慮你以前學過的東西，這就存在很多問題，使得機器在學的時候需要非常大的數據，沒有人那種長期記憶在里面，只能解決非常狹窄的問題。

雖然我們做了很多應用，但我覺得真正的智能真的沒有達到，我們要做的是怎么樣讓機器能夠自驅動來學習。這樣才能夠舉一反三達到人的智能，而僅僅只有單任務學習是不夠的。

我們怎么樣把這個事情解決呢？很多學者研究小樣本學習，或者根本不要樣本，但這個東西都是需要 Prior Knowledge（先驗知識）的，沒有知識就不可能學。這個問題就大了，這些先驗知識哪里來的？

你說是人給的，但這不靠譜，我覺得這不是一個理想的解決方案。而應該是在這個過程中積累一些知識，然后用在將來，這也是我對終身機器學習感興趣的驅動力，如果這個只是有人在這邊輔助，意義就不大了，這不是智能。

人的學習和機器學習還不太一樣，舉一個很簡單的例子，你給我 1000 個正例和 1000 個負例，然后可以讓機器學習學一個 Model 出來。可是你想想，你這輩子有過這種經歷嗎？從來沒有。

如果你沒有知識，就算給你這個東西你也學不到。比如說我現在給你中文文章，你可以看看，大概知道這個主題是什么，但阿拉伯語的文章你不懂，給你 1000個、10000 個，你能學得了嗎？我覺得你肯定學不了，除非你用了翻譯。所以，人其實不是這樣學的。

無論如何，Humans never learn in isolation from scratch（人類永遠不會從零開始學習）——不是說任何一件事情都是從頭開始，過去的什么事情都不知道。而是隨著我們從小到大積累了很多知識，然后用這些積累的知識幫助我們去學，而且需要自驅學習，就是你自己怎么樣去往前走。

比方說，人給你一個問題你去解決，人不給你問題怎么辦？那你就不管了是不是？在這個開放世界里，那你是沒辦法生存的，沒辦法得到更多的知識。

我們就是需要讓終身機器學習模仿人的學習能力。如果機器沒有這個能力真正的人工智能不可能出現，這是我自己的觀點，雖然可能跟別人可能不一樣，但我堅持己見。伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

終身機器學習正在引起人們關注，去年我跟學生寫了一本書，叫《Lifelong Machine Learning》。今年美國的 DARPA 有一個很大的項目叫做 Lifelong Learning Machines（終身學習機器）。可是，我最早知道這個事情是今年 3、4 月的時候，歐洲辦公室當時給我寄一個東西，我一看是 European Union Coordinated 的項目，就是很多國家一起搞的，叫做“智能系統的機器學習”，這個問題實在是非常的難解決，但引起了人們的重視。

在自然語言方面，舉個例子，我做 Sentiment Analysis（情感分析）的時候，就覺得這個東西好像是越學（要學的）東西就越少，這是怎么回事？之前美國一個公司也需要做情感分析，但是我們做著做著，感覺怎么這個跟以前的差不多，這個東西好像我也做過。就是雖然你覺得其實每個都不一樣，但你做著做著就覺得這個東西好像是不需要做的，差不多都是過去的東西。

所以，你們想一想人是不是這樣？從小你學習，越學越沒啥學的了？這就讓我想起來，我們能不能來建模型這個事情。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

又讓我想起了，大部分的領域的產品特征有很多重復，當然你看看這邊，每個領域都有一個 Price、Battery、Screen，現在我們的學生給百示麥（音）做一個項目，做一千多個類別，你想想，如果你一個一個去做的話，做得了嗎？

后來我們也做了一些比較，剛才有人講，我們要用經驗知識幫助解決下一個問題，可是后來又想想，這個先驗知識哪里來的？所以我們也在文章中也做了說明。

另外一個，我講的是自然語言對終身學習非常的適合，為什么呢？因為自然語言不管到什么地方，雖然存在有一些歧義，但基本上都是一樣的。

自然語言的知識自然是積累性和組合性的，有一個排列組合在里面。而且不同的 Task 其實都是相關的，不管在什么領域，你都是可以應用的。伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

我現在講一個，終身學習的定義是什么？

這是比較早的定義，我們加了一個 Knowledge Base（知識庫），就是這個長期記憶在里面，這個定義其實還不夠。在任何一個時段，我已經解決了很多的問題，現在面臨的新問題，可以用我以前學過的知識，來幫我解決問題，讓它可能做的更好，或者要很少的數據，算得更快。把這個做完了以后，知識還可以返回到這個系統里面，然后這個知識接著又可以幫將來的人做這個事情。

我們去年寫書的時候，給了一個定義，這個定義其實不夠完整。你要是從圖上看的話，那個定義基本上就是像這樣的。這個 Task 就是 T1、T2...直到最后到 Tn+1。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

這個問題就是它也有數據，這個 Learner 就是機器學習的算法得要有知識，或者說傳統那種比如 SCM，你直接上就可以，你要知道怎么樣用知識。

學術東西那邊存起來就是，還有一個就是 Past Knowledge 幫助我學習下一個問題，來學的更好。當然，然后就是輸出，所以這個定義就是根據前面那個來表述的。

現在我們的定義是這樣的，前部分還是一樣的，后面加了一些，就是最后這兩邊 Discovered new problem（發現新問題），你的模型運行的時候，要發現新的問題。要不然的話，這個也不靠譜。

另外就是說，這個世界是一個動態的、開放的世界，不能說你學到什么東西，這個世界就只有那些東西。這個世界不是封閉的，比如說自動駕駛，你如果用傳統那個學法，你這個車永遠開不了。

怎么樣發現問題，然后自動去學，你可以重新返回來，重新給我一個任務，接著學，所以這部分我們就可以閉環，這個就是自驅動學習。

我們底下加了一個的部分，就你在用這個模型的時候，我還可以接著學，就是說我用這個模型很久以后，這個模型變得更好，現在基本上算法可以做到這一點。

為什么這個很重要？因為跟人是一樣的。你在學校，老師教你學什么東西，學了這些東西，然后要下去實踐。實踐的時候還得學，不是說剛才教你了之后，老師教我啥我就只會干啥。這是不可能的事情，因為這個世界太復雜，你要有這種能耐。

最后我們就成為比較有意思的閉環，那么 Application（應用）可以非常的復雜，里面有人、還有其它東西，可以給你的環境的反饋，如果能夠這樣的話，那是比較理想化的了，這就是終生機器學習的一個定義，跟我今年做的東西有一些關系。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

另外一個就是它的主要特點是什么？其實還應該再加一個，就是一個不間斷的學習過程，不是說我不學，或者是我干這個事情就不干；還有一個是知識非得要積累，得要有一個長期記憶。

還有就是你一定要在用的時候，就是怎么樣適應、知道這個知識是否適合你，這個知識怎么樣用到你遇到的這種新情況。我們還有一個可以加的，就是說你可以自己發現問題，在運用的時候還可以自己改進。

其實很多人都在朝這個方向走，最明顯的就是 Transfer Learning（轉化學習）和 Multitask Learning（多任務學習），轉化學習大家可能都比較熟悉，就是說怎么樣用 Source Domain（源域）很多數據來幫助學這個 Target Domain（目標域），后者可能就沒有什么數據。

它還不是一個持續學習過程，還是比較人為的東西。就是說我知道這個能夠幫那個，不是說我自己去找知識，而是我知道這個能夠幫那個，所以我才這樣做。它其實也沒有一個知識積累，它還是一個單向性的。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

多任務學習其實跟傳統的也沒有太大的差別，我把很多任務一起連結優化。但也存在一些問題，它除了數據沒有知識積累，任務多樣時很難再學習。我們就想從這方面看有沒有什么突破，但這是非常難的。

我現在講幾個例子，Lifelong Supervised Learning（終身監督學習）怎么去做？別人也做了一些，但不是跟自然語言相關的。

這是一個我自己做一些情緒分類，這就是一個簡單的例子。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

現在的算法，基本上來說，如果我給你一些數據，把它放在一個終身學習的架構里面，假設我以前做過很多，但現在這些新的東西可能就不需要太多的數據。雖然這個東西是新的，但很多情況下不需要數據，因為每個東西都是很相像的。

如果我用同樣的數據，只用這個領域或者用過去的數據，它的結果可能相差非常大。過去因為我見識多，所以我做的就比你做的好。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

但是有時候又不行，為什么不行呢？這是一個很大的問題，就是你怎么知道過去的知識是不夠用的？會有兩個問題：

第一，我們現在做的很多都是 Statistics Learning（統計學習），不能保證正確性。

第二，既然不能保證正確，它到這里是不是適合？

所以，最后這個例子就是說，我們做了很多領域了，現在要做的這個領域就是個玩具。在很多領域里面，你說個東西就是一個玩具，一般來說這個是不好的，這個東西沒什么用。所以要用適合你用的，不要去用不適合你用的。

這就是兩個非常重要的問題。我們最后是用一種在訓練數據中沒有出現的東西，就是說可以考慮過去的東西好不好？適合不適合使用？

還有一個很有意思的問題，就是說如果現在只用傳統的辦法，只用訓練數據來分出這個測試數據，如果你的訓練數據沒有見過一個詞，你在測試的時候，你不敢用的，對不對？一般你是不用的，把它丟了，因為你不做這個，沒有見過，但是這里我就可以用。

另外就是說 Lifelong Unsupervised Learning（終身無監督學習），這是是我們最早做的，我們開始做的就是 Knowledge Base（知識庫），然后最后就是我剛剛說的，你讓它自己生成知識，做的更加智能。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

我們用主題模型，我可以在很多文檔找出一些主題，但它是一些詞，一些組成元素。比如說我找那個主題我也不管它是啥，比如像這些詞 Money,Dollar 這些詞。

這個問題需要很大量的知識來做這件事情，就是現實中有很多數據，結果還不一樣。過去我已經見過的這些東西，已經做過這個事情，但是在做新的時候，就可以做的很好，雖然我過去見的東西跟你這個不完全一樣，但是有很多東西是一樣的。

我就可以去找適合我用的東西，不用我不適合的。因為它有很多 Sharing，讓你可以不用，也可以用。這個算法是什么意思呢？就是說我先拿這個模型來算一下，這個數據還是有點多，我用這個模型來試的時候，基本上我知道我這里有啥。

然后我就去在我的知識庫里面就去匹配，哪些東西跟我比較像，我就可以做一些數據挖掘，給它做出比較好的結果，就是這樣的。這個全部的過程，不需要人給任何指示。不像我們以前最早做的事，需要人為給你一些東西。

比如說，我現在這個領域有一個主題。我到過去做過的東西，找到一些跟我差不多的，然后再做一個數據挖掘，這個最終是來干什么的呢？就是我要保證過去的知識是正確的，不能說我見過一次就覺得正確，而是見過很多次，然后覺得這個可能還比較靠譜，用這個知識反過來建模。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

另外一個我想講的就是怎么在開放世界中學習，當你這個算法放在這個世界里面，這個世界里面不光是你需要去學會的東西，還有其它的東西你沒有學過。你沒有學過怎么辦？

我們現在機器學習基本上是一個很狹窄的，因為我學到的東西跟我將來見的東西是一樣的，比如說我現在做一個分類，其實是說現在學的時候有 5 個 Class，在用的時候，我覺得這個世界里只有 5 個 Class，沒有別的東西。你想想這東西靠不靠譜？如果你想做自動駕駛的話，你絕對沒辦法開始。因為自動車要見的東西太多了，太復雜了。

這個系統如果不知道它們自己知道什么，不知道什么，它是沒辦法學習的。如果這個事情全都是我知道的，那你學什么呢？所以你要知道什么東西你不知道，然后你才能越學越多，這個是什么問題呢？當然問題很簡單，就是說我現在學的很多 Class，我的 Class Level 是從 1 到 P 的。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

假設這個開放域還有其它的東西，我不知道這個東西是什么，但是最起碼要知道這個東西我知不知道。然后你的模型要自己想一想怎么辦，要是你采取這種方式，這個算法就要改一改。

我們講個算法，第一個算法就是比較簡單的一個算法，是一個 Space Transformation（空間轉換），但是我們做的效果不是很好。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

下面是傳統學習和 CBS 學習的一個比較。假設你在實踐中見到這些一些其它的東西，你怎么辦？如果是傳統的分類的話，就是說這個是正的，但是這個肯定是不合適的，對不對？

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習

然后，我們應該怎么做呢？辦法就是在這里找一個中心點，在這個陣列里每個 Class 基本上找一個中心，比如說這個中心在這里，我們就可以做。在那個 Space 上做一個 Learning，再回到這個 Space，是不是基本上就是個圓。這樣的話，就可以做到我知道這個不是我，我見到新的東西了，要去學這個新的東西。

伊利諾伊芝加哥分校教授劉兵：自然語言處理的下一層級——終身語言學習