• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給溫曉樺
    發送

    1

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    本文作者: 溫曉樺 2016-12-17 20:33 專題:2016中國人工智能產業大會
    導語:把VC維度理解為腦細胞維度。而機器的維度也需要更多的腦細胞,才能更聰明,才能學習更多的知識。機器的誤差隨著模型維度的提升而降低。

    今天大家討論比較多的人工智能,包括深度學習等這些技術為什么會對我們有幫助?究竟背后在什么地方能夠去改變這個世界?在今天于深圳舉辦的中國人工智能產業大會上,人工智能公司第四范式創始人兼CEO戴文淵就其專業研究以及產業實踐對這些問題做了闡述。雷鋒網也與其進行了訪談。

    第四范式是一家利用機器學習、遷移學習等人工智能技術進行大數據價值挖掘的公司,其CEO戴文淵被業內認為是遷移學習全球領軍學者。據雷鋒網了解,戴文淵2005年曾獲得ACM國際大學生程序設計競賽世界總冠軍。他2009-2013年就職于百度,是百度廣告變現算法的核心負責人,也是百度鳳巢的總架構師,是最年輕的百度高級科學家,2012年獲得百度最高獎(百萬美元獎)。在其后的2013-2014年,戴文淵就職華為,任華為諾亞方舟實驗室主任科學家。

    戴文淵表示,大數據不再是AI發展瓶頸,未來企業的機遇在于贏在“維度”。如果企業內部用人工智能知道企業經營,最重要的就是要去做高VC維模型,我們要不斷地提高模型的維度,使得training loss和test loss不斷的降低。VC維度是什么?大腦的維度大概就是大腦腦細胞的個數,所以可以把VC維度理解為腦細胞維度。而機器的維度也需要更多的腦細胞,才能更聰明,才能學習更多的知識。機器的誤差隨著模型維度的提升而降低。

    “VC維”是什么?

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    VC維度是什么東西?學術一點來說是“Vapnik-Chervonenkis Dimension”,一個由Vapnik和Chervonenkis于1960年代至1990年代建立的統計學習理論,它反映了函數集的學習能力——VC維越大則模型或函數越復雜,學習能力就越強。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    戴文淵以一個比喻解釋:大腦的維度大概就是大腦腦細胞的個數,所以為什么人比狗聰明,狗比蟑螂聰明,因為人的腦細胞比狗多,所以可以把VC維度理解為腦細胞維度。同時這就可以理解:為什么要把機器的維度做高——因為機器的維度也需要更多的腦細胞,才能更聰明,才能學習更多的知識。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    上圖是IMGENET比賽的結果示意圖。過去對于這個比賽,大家關心最多的是黑線曲線——它表示著是每年冠軍的錯誤率。因此大家都知道,每年冠軍的錯誤率誤差都在降低。但是戴文淵看到的是另一個問題:很少有人關心黃色的曲線——它代表著每年冠軍模型的VC維。所以這是我們也可以發現,為什么錯誤率會降低?是因為模型的維度在提升。隨著模型維度的提升,我們的誤差開始降低。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    所以,今天的深度學習、強化學習都是要把維度做大?!吧疃葘W習其實是一種更好的去把VC維做高的算法,”戴文淵說道,“而為什么要做強化學習?強化學習是一個不斷VC維做得越來越大的模型。舉個例子——谷歌的阿爾法狗,如果只做深度學習,它是基于KJS的網站上棋局做的模型,那只有30萬局棋;強化學習以后,通過自己和自己下,不斷地去提升,最后能夠達到8000萬局棋,所以這就是今天強化學習要做的事情,這都是要把維度越做越大?!?/p>

    三個案例說明:為什么需要把VC維做大

    維度做得更高更細,分析才能做得更精細,效率才能夠提高。

    去年亞馬遜的市值超過了沃爾瑪,更多的人會覺得亞馬遜超過沃爾瑪是互聯網顛覆傳統企業的。但這真的是互聯網方面帶來的厲害?“其實這背后是人工智能。在2010年前亞馬遜做的并不是比沃爾瑪成功的,但之后,亞馬遜基于其數據能夠讓大家看到亞馬遜的商品都是不一樣的,亞馬遜實際上是給每個人開了一家店?!?/span>

    一家企業如何能同時開出3億多家個性化的店?亞馬遜有3億多的用戶,而沃爾瑪有一萬多家店,亞馬遜顯然是要解決一個比沃爾瑪復雜3萬多倍的問題。

    “要解決3億多家店,就不是那么好解決,不太可能人工去設計布置3億多家店,這由誰來解決?由機器解決。機器沒有精力的局限,人不是說如何去開更多的店,而是人沒有精力開那么多店,用機器解決就是人工智能幫助亞馬遜超過沃爾瑪最重要的地方。”

    所以,維度做得更高更細,分析才能做得更精細,效率才能夠提高。

    除了客戶管理方面,倉儲也體現了亞馬遜人工智能分析維度的作用。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    戴文淵介紹,沃爾瑪的倉儲是所有的保管員、倉庫配貨員都會去倉庫整理東西,但是亞馬遜的機器人是——需要這個貨物就搬過來,如果亞馬遜有個N個配貨員就有N種不一樣的貨架,這樣的擺放也是基于數據來做的,最后造成的一個差別就是——亞馬遜比沃爾瑪提升4倍。

    過去我們談互聯網,移動互聯網,現在談人工智能,其實互聯網和移動互聯網時代,有大量的空地,我們做一個網站,可以圈一批客戶,我們做一個APP可以圈一批客戶,而到今天這個機會已經沒有了,未來的機會在哪?不是說還有更多的客戶可以去圈,而是我可以做得更好。如果要讓一家企業做得比競爭對手更好,就會把預算搶過來,就像亞馬遜從沃爾瑪那邊搶過來一樣。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    另外一個案例是臉書(Facebook),此前該公司因為變現能力受到質疑而股價一直往下走,但現在是很風光的狀態。戴文淵講起這背后的故事:

    在2012年,戴文淵面試過一些來自臉書的工程師,面完了以后他發現,不是臉書不能賺錢,而是當時的技術不足以(實現)很高的變現效率。“我當時問了工程師一個問題‘臉書的廣告有多少的變量?’,他們告訴我有兩千多的變量,于是他就沒有通過面試,因為我們當時已經做到了一百多億的變量,這是巨大的差別?!?/span>

    但是臉書發生了一個很大的變化,這是谷歌幫了他們。當年谷歌印度人與白人團隊的戰爭,導致白人團隊離開谷歌到了臉書,幫助他們把變量數從兩千多個提升多了兩千多億個。這一下子讓臉書的變現能力大幅度提升,之后他們的財報都超過了華爾街的預期。

    所以這里很關鍵的地方是維度。原來是用機器學習——也是用大數據做的廣告模型,但是做得不夠高不夠細,如果能夠把維度做得更高,你就能做得更精細,你的效率就能提升,獲得更多的廣告市場。

    VC維做高做大后還讓AI產業有更大的想象空間

    除了互聯網IT這些數據密集型的行業,金融業也是數據量不可小覷、用戶群體涉及廣泛的行業,因此,這首先也成為了AI產業應用孵化的首選之地。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    “今天已經不再是亞馬遜、谷歌或者BAT的時代,如果退回五六年前做AI,就只能去BAT,在美國可能是谷歌臉書這樣的公司,但今天其實有更多的企業擁有數據?!?/span>

    戴文淵介紹了第四范式與銀行合作的案例,其客戶是一家深圳的股份制商業銀行。作為一家商業銀行,他們也有很多營銷數據,需要通過這些數據去精準識別所有客戶當中有哪些是分期客戶,歷史上有大量的客戶辦分期或者不辦分期,第四范式的任務是基于銀行的數據幫助他們更好地識別。

    “過去他們不是不做營銷,他們也是做營銷的,但是他們的模型維度只有兩百多個,而我們通過數據,通過機器學習,幫助他把維度提升到了五千萬,從兩百到五千萬的精細營銷,甚至我們可以幫他發現一些業務規律。比如當有一筆交易出現在某一個POS機,這個POS機一個月只有兩百人使用的時候,是一個商機。所以,通過機器就能夠用更高效、更低成本的方式來識別出這些場景?!?/span>

    做高維度是與過去理論相悖的,為什么今天可以做到?

    根據前面講到幾個案例,戴文淵表示,最大的差別就是過去我們在做的事情是低維的事情,而現在做的是高維的事情。“這可能跟我在學生時代學習的一些基本原理是相違背的——過去我們學數據挖掘的時候,有一個叫奧卡姆剃刀原理,它講的是盡可能簡單,而不是做深維的事情,而我們現在不是做化繁為簡,而是把問題做復雜?!?/span>

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    他繼續解釋說:

    比如說(圖右)奧卡姆剃刀原理區分紅點和藍點的時候,到底是選擇綠色的線區分還是黑色線區分?過去的教科書是說黑色比綠色好,現在我們認為是綠色比黑色好。為什么呢?過去的奧卡姆原理在做神經網絡的時候,為什么我們要把神經網絡控制在三層以內?是因為那個年代的數據量不夠。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    那個年代的數據不多,所以數據不足以支撐我們把數據做大。在數據量不大的時候,我們要化繁為簡。而真正統計學習的基石并不是奧巴姆剃刀,不是說要控制三層,真正統計學習的原理叫VALIANT引理——這個公式我們可以就理解成,其實要做到的是模型的復雜度和規則數或者變量數,這樣一個數據量相匹配。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    從這個原理我們會知道——為什么過去做的模型簡單,為什么神經網絡要深度學習?重點的原因就是現在數據量變大了。數據量變大了,模型的復雜度要和數據量成匹配,要相關。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    所以,以往的定律、原理也許都是局限下的產物。“牛頓三大定律交給計算機做會怎么做?可能不是三大定律,可能是做速度區間劃分,如果說總結出三千萬個定律的時候可能就不需要相對論了,這就是大數據時代,我們怎么讓機器做到一些不一樣的事情?!?/span>

    “從VALIANT引理來看,為什么牛頓提的是三大定律而不是三百三千定律?就是人的記憶是有局限的,人腦里面裝不了大數據,所以人能產出的就是簡單的模型。為什么說過去的算法也很簡單?過去做決策,要減到五千以內,其實很重要的原因是過去的數據量有限?!?/span>

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    今天整個時代變了,我們從互聯網上可以獲得大量的數據,傳統企業其實也有大量的數據,比如說華大基因要測百萬人的基因,中石油每天探測回來的地震波有500T,招行每月會有幾億的交易,這些都是非常大的數據。這時候如果還是套用valiant引理的話,數據量大了,模型會復雜。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    “‘奧卡姆’時代過去了。從工業界來說,如果我們企業內部做人工智能指導企業經營,最重要的就是我們要去做高VC維模型,我們要不斷的去提高模型的維度,使得training loss和test loss不斷的降低。”

    用小數據實現超高維的遷移學習,是下一個研究風向?

    現在也有在討論遷移學習,遷移學習要做的是什么呢?

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    戴文淵向雷鋒網表示,遷移學習最佳的應用場景在于醫療?!安皇撬袌鼍岸加写髷祿?,比如說醫療。再比如,很多人覺得今日頭條做的是個性化推薦,千人千面。其實他們不是在做個性化,而是做遷移學習。如果頭條只有你的數據,絕對不可能給你服務得好,服務得好是因為有了你的數據,可以找到很多跟你相近的數據。今日頭條最強的是在于他能夠拿和你相近的哪些人的數據來幫助到你。所以它是一個遷移學習的問題,因為每個人提供的數據是有限的,不是一個大數據,真正的幫助是來自于周圍,遷移學習就是說小數據也能做到高緯度?!?/span>

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    上述是人與人之間的遷移,另外一個例子是領域的遷移。領域的遷移是什么呢?舉例來說,像金融。金融資產管理中,做一個業務資產也許幾十億上百億,但是如果換一個視角看,上百億的資產做小額信貸,數據量非常非常大。但是如果上百億資產拿來做大額信貸,比如說房貸,每個人貸幾百萬并沒有多大數據,那么問題來了——大額信貸沒有大數據就很難用現在的深度學習來做。

    “我們現在也在關注金融領域。遷移學習恰恰是可以幫助金融業企業利用各種各樣的信貸數據,無論是大額信貸還是小額信貸,來提升模型的效果。比如在銀行中,我們利用其小額消費金額的數據,幫助他做汽車貸款,也就是用別的領域的數據來提升效果,最后能夠幫助他的營銷提升?!?/span>

    所以遷移學習要解決的是小數據實現超高維。另外一個數據是專家經驗,如果說既沒有數據,又沒有其他領域的知識,我們還可以用專家經驗來降低數據的使用量,提升小數據的模型維度。


    我們今天會發現很多的話題在討論人臉識別或者無人車,個性化推薦,有人討論深度學習、強化學習,最關鍵的是所有事情都在解決一個問題就是維度。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

    第四范式戴文淵:大數據不再是AI發展瓶頸,未來企業贏在“維度” |2016 CAIIC

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 精品国产亚洲一区二区在线3d| 国产AV大全| 美女张开腿给男人桶爽久久| 亚洲 欧美 唯美 国产 伦 综合| 国产成人精品优优av| 三上悠亚精品二区在线观看| 加勒比无码人妻东京热| 久久久噜噜噜久久中文字幕色伊伊| 欧美日韩视频综合一区无弹窗| 日韩久久中文| 天干天干夜啦天干天干国产| 亚洲天堂视频在线观看| 国产三级在线一区二区| 无套内射极品少妇chinese| 国产成人精品一区二区无| 国产一区日韩二区三区| 久久天天精品麻豆国产| 日本午夜精品伦理一区 | 色亚洲成人| 亚洲成AV人国产毛片| 人妻另类 专区 欧美 制服| 国产精品一亚洲av日韩| 欧美人成精品网站播放| 久久精品女人天堂aaa| 中文字幕卡二和卡三的视频| 国产a级三级三级三级| 国产精品无遮挡猛进猛出| 黑人巨茎大战欧美白妇| 欧美久久gogo日本大胆欧美人| 亚洲av无码片在线播放| 无码视频伊人| 国产99视频精品免费视频6| 国产精品免费看久久久无码 | 日本高清无卡码一区二区| 亚洲第一区第二区第三区| 性色av一区二区三区无码| 国内亚洲精彩视频在线| 国产精品99中文字幕| 麻豆久久天天躁夜夜狠狠躁| 免费一区二区三区| 一区二区三区无效卡|