人工智慧晶片大戰 Intel回擊nVidia:GPU 伺服器市占率可憐

Intel回擊nVidia:GPU 伺服器市占率可憐

Intel和NVIDIA多數時候是親密戰友(PC電腦領域),但最近一段時間在人工智慧戰場卻鬧得非常不愉快。

NVIDIA近日對外表示,在數據中心和伺服器的運算計畫取得了很大的進展。使用GPU來處理人工智慧的應用,例如深度學習網路,效果很好。

關於這一點,Intel是一個字也不同意。 Intel聯合副總裁兼數據中心經理Jason Waxman親自在部落格撰文,先不評論GPU在機器學習上是否有價值,事實是,Intel統治了97%的AI伺服器市場,只有不到3%的設備依靠的是GPU。

2005ea90eb3723a.png_600x600

Intel還表示,自己在人工智慧計算方面也會一直處於前端地位。

這番言論得到了一些個人和團體的支持,華盛頓大學教授Pedro Domingos聲援Intel,Intel的確一直在硬體方面支持我們對AI的研究。

NVIDIA並未坐視不理,它們企圖糾正Intel的“誇誇其談”,Intel多年來為科技界帶來了很多創新,我們也公佈並堅決捍衛自己的數據,消費者和客戶都是明眼人,孰是孰非自有公斷。

前不久NVIDIA與Intel 還為了Xeon Phi與Maxwell GPU的效能相互叫陣。

 

 

英特爾對外公佈了Xeon Phi的基準測試結果,引來業界廣泛關注。根據英特爾的說法,Xeon Phi是「整合眾核架構」處理器,基於Atom CPU而非GPU打造,不僅更高效,而且具備比GPU更強的深度學習性能。

s_f6dfa8b17e6543cc859105a03319cbe1

英特爾明確表示,Xeon Phi處理器比Nvidia Tasla顯卡功耗低40%。此舉顯然惹怒了Nvdia,Nvdia在自家部落格中發了篇文章,列出種種原因,稱英特爾的測試結果有「作弊」嫌疑。

不管英特爾與Nvidia孰是孰非,可以肯定的是GPU是時下訓練深度學習神經網路的主流選擇。這是因為訓練深度學習神經網路要求低精度計算,GPU符合這一標準,而CPU卻是為執行高精度計算而生。至於GPU未來是否會被更有效的產品替代,還有待觀察。

過去幾年裡,Nvidia一直在優化GPU的深度學習性能。另一方面,Nvidia也在GPU架構的開發上加大投資,以方便開發人員訓練深度學習神經網路,這也是機器學習研究人員會首選Nvidia而非AMD的主要原因。 Nvidia表示,與Kepler架構相比,Pascal架構的機器學習性能提升了好幾個檔次。

然而,GPU不是訓練深度學習神經網路遊戲中的唯一玩家。深度學習神經網路蓬勃發展,新老企業紛紛插足,希望能分得一杯羹。

有些公司希望藉由FPGA來加速深度學習,Google、CEVA、Mocidius專注於開發自定義的深度學習晶片。而英特爾則希望用擁有幾十個Atom核心的Xeon Phi處理器,與GPU競爭。

英特爾的報告

1471513020413

在報告中,英特爾稱,4個Knights Landing Xeon Phi處理器比「4個GPU」快2.3倍。

英特爾還稱,在多個計算結點上,Xeon Phi處理器的可擴展率比GPU高38%。

它還說,128個Xeon Phi處理器構成的系統,比單一Xeon Phi處理器構成的系統,快50倍。這意味著Xeon Phi處理器的擴展性很棒。

此外,英特爾還在報告中指出,使用英特爾優化過的Caffe深度學習框架,Xeon Phi晶片比標準Caffe硬體快30倍。

Nvidia的反駁

c7400078e8c2f4c271d

對英特爾在論文中所舉種種,Nvidia不屑一顧。 Nvidia將矛頭對準基準,稱英特爾在基準中使用了過去的數據。 Nvidia指責英特爾將使用了舊數據的基準與GPU進行比較是誤導大家,因為該公司的GPU從28奈米製程轉變為16奈米FinFET製程後,性能、效率都得到了大幅提升。與此同時,過去幾年裡,Nvidia也對旗下多個GPU框架進行了優化。

基於上述種種,Nvidia稱,如果英特爾使用最近的Caffe AlexNet測試數據,就會發現4個Maxwell GPU比4個Xeon Phi處理器快30%。

至於英特爾在論文中所說的「可擴展率高38%」,Nvidia表示,英特爾將該公司四年前的Kepler架構Titan X GPU,與Xeon Phi處理器對比,本就有失公平。 Nvidia還援引百度的數據稱,語音訓練負載在128個Maxwell GPU上幾乎呈線性擴展。

Nvidia認為,深度學習最好使用幾個強的結點,而不是多個弱的結點。 Nvidia還指出,一台DGX-1超級計算機的速度比21個Xeon Phi處理器還要快,是4個Xeon Phi處理器速度的5.3倍。

人工智慧晶片競爭白熱化

種種跡象顯示,英特爾Xeon Phi處理器在深度學習領域,仍然落後於GPU。但從另一個角度來看,就算Nvidia的DGX-1超級計算機速度比21個Xeon Phi處理器快,至少英特爾的Xeon Phi處理器更有價格優勢。

23ebea1021e8f12.jpg_600x600

一台DGX-1超級計算機的成本是12.9萬美元,而Xeon Phi處理器的價格從2000美元至6000美元不等。即便DGX-1超級計算機可與21個Xeon Phi處理器匹敵,但其價格仍比Xeon Phi組合貴。

很顯然,英特爾與Nvidia的戰爭在未來幾年會日趨激烈。但更有趣的是,Google TPU之類ACIS晶片能否漁翁得利。

英特爾在Phi協處理器中大量使用「通用」核心,而Nvidia仍必須為遊戲優化其GPU。換句話說,兩家公司都不會極端追求晶片的深度學習性能。與此同時,軟體在發展深度學習晶片過程中意義重大,而Nvidia無疑有最強的軟體支撐。

 

via: venture beat

出處:快科技

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

Loading