• <sub id="pqc61"><p id="pqc61"></p></sub><sub id="pqc61"></sub>
    在线精品视频一区二区,亚洲中文字幕无码一久久区,正在播放肥臀熟妇在线视频,国内精品视频一区二区三区八戒 ,国产毛片三区二区一区,国产精品一区中文字幕,丰满少妇被猛烈进出69影院,国产成人无码
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給訾竣喆
    發送

    6

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    本文作者: 訾竣喆 2016-04-07 12:29
    導語:昨日,Nvidia在GTC 2016大會上正式發布了新一代的Pascal架構顯卡,作為該家族中第一張亮相的顯卡,Tesla P100正式亮相。

    昨日,Nvidia在GTC 2016大會上正式發布了新一代的Pascal架構顯卡,作為該家族中第一張亮相的顯卡,搭載新核心GP100的Tesla P100正式亮相。

    據Nvidia介紹,NVIDIA Tesla P100將由臺積電代工,并使用與華為麒麟950同等工藝的16nm FinFET打造,將擁有高達153億個晶體管和16GB 4096 bit HBM2堆疊內存。

    在計算能力上,Tesla P100可提供5.3 Teraflops的雙精度性能、10.6 Teraflops單精度性能以及適用于深度學習的21.2 Teraflops半精度性能。

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    雖然被削,參數依然漂亮

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    從這張P100與K40、M40的參數對比圖中,可以看出Tesla P100中的GP100其實是“閹割版”,這一點Nvidia官方也已承認:

    • 標準的GP100核心中應該內建有3840個CUDA核心、240個紋理單元以及最高支持32GB的HBM2顯存;

    • 而P100中的GP100核心卻采用了3584個CUDA核心、224個紋理單元以及被削減了一半的16GB HBM2顯存。

    而這直接帶來的就是在單精度運算上的提升幅度并不明顯——

    10.6 Teraflops的運算能力與前代的7 Teraflops相比只提升提升了50%。

    雖然50%看起來已經挺多了,要知道CPU近年來的換代性能提升也不過10%左右。然而,考慮到P100從28nm LP制程到16nm FinFET制程的跨越,以及新架構帶來的優化,這個數字遠沒有達到此前15Tflops的預期。

    不過這也可能是出于對成本的考量,畢竟P100是面向高性能通用計算領域開發,將大部分晶體管性能放在了雙精度運算性能上將更具性價比。

    相比于GK110的0.2 Teraflops,P100 5.3 Teraflops的性能提升非常的可觀。即使是和2013年的K40相比,也已經翻了4倍。

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    與友商的對比

    AMD

    在幾天前的3月31日,友商AMD也發布了自家新一代旗艦級計算卡FirePro S9300 X2。

    FirePro S9300 X2中搭載了兩顆AMD Fiji架構核心、兩組4096-bit 4GB HBM 顯存,單精度浮點性能在13.9 Teraflops,雙精度浮點性能為0.8 Teraflops。

    P100與之相比,在單精度浮點性能顯得稍遜一籌。不過考慮到AMD采用的是雙核心解決方案,而且此次P100也在單精度浮點上做了閹割,如果是拼單核恐仍難逃被Nvidia吊打的命運。

    Intel

    另一方面,Intel也已于2015年11月對旗下的對標產品——第二代Xeon Phi做了預告。

    據稱新一代產品代號為“Knights Landing”,同樣采用14nm工藝。搭載72顆Silvermont架構核心,單顆支持四線程,總計288個線程。計算方面,雙精度浮點性能將達到3 Teraflops,單精度為6 Teraflops。

    從數據上也能看出,CPU與GPU在通用計算效率上的劣勢即使是老大哥Intel也無能為力。

    應用場景

    NVIDIA DGX-1

    在大會上,老黃還高調宣布了基于Tesla P100打造的深度學習服務器——NVIDIA DGX-1。

    據介紹,DGX-1可以提供170 Teraflops的深度學習計算性能,比自家一年前提出的NVIDIA Maxwell架構四路解決方案快12倍,以前需要25個小時完成的訓練任務現在2個小時就可以完成。

    雖然性能十分可觀,但是售價也是十分嚇人的——一臺的售價為129,000美元(約合835,000元人民幣)。

    NVIDIA Drive PX 2

    雖然GTC大會上,基于GP100頂級核心的Tesla P100被多家媒體稱為“首款Pascal架構的產品”。但其實今年1月,基于Pascal架構的Drive PX 2自動駕駛平臺就已經發布,只是當時并沒有正式公布而已。

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    此次,老黃公布了Drive PX 2的具體參數:

    • CPU:8核A57+4核 Denver 架構核心

    • GPU:2顆Pascal架構獨立顯卡

    • 內存:8GB LPDDR4

    • 功耗:250W

    • 其他特性:水冷

    其中每顆顯卡核心為GP106核心,主頻為1.25GHz,搭配80GB/s帶寬、128bit位寬的4GB GDDR5顯存。單精度浮點運算性能為8TFLOPS。

    花20億美元打造P100,但Nvidia只是拿來畫了一張餅

    在現場,Nvidia還展示了基于這款自動駕駛平臺打造的無人駕駛賽車——“Deep Green”。它將代表參加2016-2017賽季無人駕駛賽車競技大賽“ROBORACE”。

    后記

    雖然每次Nvidia發布新產品都能給人以眼前一亮的感覺,但是我們如果冷靜下來分析不難看出Nvidia此次發布新品并沒有此前那么有底氣。

    P100作為第一款應用16nm工藝的產品,初期的良品率應該不會如28nm那般成熟,而再加上現場看到的散熱模塊仍然是經典的單風扇散熱,以及300W的TDP,不難想象這又將是Nvidia新一代“高性能核彈”。

    雖然老黃在現場講了許多使用場景,但是卻絲毫沒有提跑分成績。這不禁讓人想起在年初的CES 2016上,首次發布GP100核心之時卻使用GM200核心充數拿上臺被人無情拆穿的情景。

    相比于AMD在年初的發布會上現場上機跑分,或許,不敢如此做的Nvidia只是因為老黃拿著的是套了散熱器(為了讓人看不出來里面的核心)的PCB板子而已吧。

    在GM200上Nvidia還選擇大幅削減雙精度計算,從而減少發熱量和成本,而此次剛剛步入16nm工藝就如此大跨步的追求性能極致,恐怕進入量產和實際應用之后問題就將會凸顯。而首當其沖的就是HBM2顯存量產問題,畢竟目前連AMD率先推出的HBM一代都沒做到量產,直接跨到HBM2,AMD對此也只能呵呵了吧。

    畢竟,步子邁太大,容易扯到蛋。

    雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。

    分享:
    相關文章

    萌萌噠編輯

    宅男一枚,興趣廣泛,歡迎閑聊。微信:zjz723172434;郵箱:721372434@qq.com
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說
    主站蜘蛛池模板: 国产精品免费综合一区视频| 免费国产线观看免费观看| 人妻熟妇乱又伦精品HD| 精品久久久久久久中文字幕| 亚洲男人天堂一级黄色片| 曾医生17分钟??下载| 日韩精品一区二区三区不卡| 色www88| 国产最新AV在线播放不卡| 久久综合五月丁香六月丁香| 内射白浆一区二区在线观看| 国产精品久久久久影院亚瑟| 国产亚洲精品岁国产精品| 亚洲综合成人网| 偷窥与偷拍| 国产成人综合久久精品| 久久精品综合国产二区| 日韩在线成年视频人网站观看| 一区二区三区四区高清自拍| 国产AV一区二区三区| 国产精品久久久影视青草| 国产欧美日韩一区二区三区| 亚洲精品午夜天堂网页| 欧美乱人伦人妻中文字幕| 国模无吗一区二区二区视频| 国内精品免费久久久久电影院97| 国产成人精品电影在线观看| 新源县| 亚洲a免费| 3p无码| 国产精品美女黄色av| 国产精品亚洲电影久久成人影院| 麻豆一区二区三区蜜桃免费| 99久久香蕉国产综合影院| 淫荡人妻中文字幕| 亚洲精品一区久久久久一品av| 国产亚洲网| 久草视频免费在线播放| 精品亚洲欧美中文字幕在线看| 91TS人妖另类精品系列| 亚洲AV日韩Aⅴ无码色老头|