• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發(fā)私信給亞萌
    發(fā)送

    0

    百度引入Ring Allreduce算法,大規(guī)模提升模型訓練速度

    本文作者: 亞萌 2017-02-22 19:25
    導語:百度硅谷人工智能實驗室(SVAIL)宣布將Ring Allreduce算法引進深度學習領(lǐng)域,這讓基于GPU訓練的神經(jīng)網(wǎng)絡(luò)模型的訓練速度顯著提高。

    雷鋒網(wǎng)消息,美國西部時間2月21日,百度硅谷人工智能實驗室(SVAIL)宣布將Ring Allreduce算法引進深度學習領(lǐng)域,這讓基于GPU訓練的神經(jīng)網(wǎng)絡(luò)模型的訓練速度顯著提高。

    Ring Allreduce是高性能計算(HPC)領(lǐng)域內(nèi)一個眾所周知的算法,但在深度學習領(lǐng)域內(nèi)的應用相對較少。而百度SVAIL實驗室研究員Andrew Gibiansky也錄制了一個視頻介紹了關(guān)于Ring Allreduce的基本情況。

       

    高效并行訓練的需求

    隨著神經(jīng)網(wǎng)絡(luò)參數(shù)越來越龐大,從幾億個參數(shù)與到數(shù)十億參數(shù),所需的GPU運算節(jié)點也在增加。然而,節(jié)點數(shù)量越多,整個系統(tǒng)的效率就會降低。

    深度學習在多個GPU上訓練神經(jīng)網(wǎng)絡(luò)通常比較困難,因為大家普遍采用的方法是,讓多個GPU把數(shù)據(jù)發(fā)送給一個reducer GPU上,這會造成一種通信瓶頸,整個訓練速度會因此拖慢。而且要訓練的數(shù)據(jù)越多,則帶寬瓶頸問題就顯得越嚴重。

    百度引入Ring Allreduce算法,大規(guī)模提升模型訓練速度

    而ring allreduce算法移除了這種瓶頸,減少GPU發(fā)送數(shù)據(jù)花費的時間,而把時間更多用在處理有用工作上。SVAIL發(fā)布的博文中這樣說道:

    “ring allreduce 是這樣一種算法——其通信成本是恒定的,與系統(tǒng)中的 GPU 的數(shù)量無關(guān),并且僅由系統(tǒng)中的 GPU 之間的最慢連接來確定。事實上,如果在通信成本上你只考慮帶寬這一因素(并忽略延遲),那么 ring allreduce 就是一個最佳的通信算法 。


    算法的進行分兩步:第一步,scatter-reduce;第二步,allgather。在第一步中,GPU 將交換數(shù)據(jù),使得每個 GPU 最終都有一個最終結(jié)果的數(shù)據(jù)塊。在第二步中,GPU 將交換那些塊,使得所有 GPU 最終得到完整的最后結(jié)果。“

    Ring Allreduce 中的 GPU 被布置在一個邏輯環(huán)路(logical ring)之中。每個 GPU 左右兩個各有一個 GPU,并且只從左邊的 GPU 接收數(shù)據(jù),再把數(shù)據(jù)發(fā)送至右邊的 GPU。

    百度引入Ring Allreduce算法,大規(guī)模提升模型訓練速度

    Ring Allreduce在接受采訪時說道:

    “Ring allreduce可以讓我們在多設(shè)備和多節(jié)點的情況下,更加有效地平均梯度。在訓練中使用這個帶寬優(yōu)化的算法,你可以顯著減少通信開銷,并由此擴展到更多的設(shè)備上,同時仍然保留同步隨機梯度下降的確定性和可預測的收斂性。”

    百度已經(jīng)用這個算法來訓練其語音識別模型,實驗證明,與使用一個單獨的reducer GPU相比,ring allreduce 可以將一個神經(jīng)網(wǎng)絡(luò)在40個GPU上的訓練速度提升31倍。

    百度也將這算法分享出來,發(fā)布了一個演示該 allreduce 算法的 C 語言庫,也將該 allreduce 以補丁的形式整合到 TensorFlow 中。

    另一個HPC與機器學習結(jié)合的例子

    雷鋒網(wǎng)此前也報道過,最近日本東京技術(shù)研究院宣布,將在今年夏天啟動日本“最快的AI超級計算機”項目,這個超級計算機名為Tsubame3.0,使用的是英偉達GPU加速芯片,使其性能較以往提升2倍。HPC市場與快速興起的AI市場有很大不一樣,超級計算機以往被用于例如天氣預測、氣候建模、太空和核模擬等領(lǐng)域,而針對AI優(yōu)化的芯片開始將這兩個領(lǐng)域結(jié)合起來。而百度這次,則將HPC領(lǐng)域的軟件技術(shù)應用于深度學習領(lǐng)域,看起來,HPC和機器學習這兩個領(lǐng)域,正在以非常快的速度融合。

    Via Tomshardware

    更多雷鋒網(wǎng)相關(guān)文章:

    三星計劃投入 10 億美元收購 AI 公司

    AI加持,計算機要擁有嗅覺了

    百度引入Ring Allreduce算法,大規(guī)模提升模型訓練速度

    分享:
    相關(guān)文章

    編輯

    關(guān)注人工智能(AI)報道
    當月熱門文章
    最新文章
    請?zhí)顚懮暾埲速Y料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
    立即設(shè)置 以后再說
    主站蜘蛛池模板: 亚洲成a人片77777国产| 黄色日本视频| 亚洲欧美综合中文| 少妇高潮水多太爽了动态图| 非会员区试看120秒6次| 人妻熟女一二三区夜夜爱| 免费国产裸体美女视频全黄| 91草莓视频| 精品无码久久久久久久久久| 亚洲大尺度无码无码专线| 99蜜桃在线观看免费视频网站 | 不卡色老大久久综合网| 中文日产幕无线码一区中文 | 麻豆蜜桃av蜜臀av色欲av| 波多野结衣绝顶大高潮| 国产精品一在线观看| 一本一道av中文字幕无码| 午夜剧场黄色| 国产精品无码久久AV不卡| 起碰免费公开97在线视频| 日本高清一区二区在线观看| 国产哺乳奶水91在线播放| 国产成人精品无码一区二区| 伊人免费在线| 久久亚洲中文字幕精品一区| 精品国模一区二区三区| 久久精品熟女亚洲av麻| 在线99国产| 美女扒开下面流白浆在线试听 | 综合偷自拍亚洲乱中文字幕| 金华市| 日韩亚洲精品中文字幕| 精品视频在线观自拍自拍| 亚洲精品一区二区三区蜜桃| 成人AV鲁丝片一区二区免费| 国产成人不卡一区二区| 在线播放深夜精品三级| www.操操操| 国产品精品久久久久中文| 国产精品美女| 麻豆精品在线视频|