有了這款可擴展、分布式的深度學習軟件,IBM就能和AI巨人一起共舞
IBM公司在21世紀早期引進了Watson,從而進入了人工智能現在的周期,并且從那時候開始在不斷加大力度。最近,IBM發(fā)布了PowerAI,IBM的軟件工具包解決方案與OpenPower系統配合使用,針對那些不想完全從頭開始開發(fā)自己的AI解決方案,但是仍然希望定制滿足自己特定深度學習需求的企業(yè)。如今,IBM Research公布了一項新突破,這將只會進一步加強PowerAI和其它的AI產品,這是一個在過去六個月中我所看到的突破性的分布式深度學習軟件。
擺脫單點瓶頸
所有一直關注人工智能的人都知道,深度學習在近幾年才真正發(fā)展起來。它為商業(yè)領域和消費者的百個應用程序提供支持,并且在持續(xù)增加。然而,阻礙深度學習進一步激增的最大問題之一是可擴展性問題,F在大多數AI服務器只是一個單一的系統,而不是多個系統的組合。最流行的開源深度學習軟件框架在多個服務器上表現不佳,造成了一個耗時的瓶頸。換句話說,盡管許多數據科學家已經可以訪問4到8個GPU服務器,他們不能利用它擴展到單個節(jié)點之外,到目前為止,這個軟件并不是為此而設計的。
輸入IBM DDL庫:這個庫使用IBM Research的獨特集群方式構建,連接到領先的開源AI框架(如:TensorFlow, Caffee, Torch, 和Chainer)。通過DDL,這些框架能擴展到數十臺IBM服務器,利用數百個GPU—一種舊的晝夜不同的處理模型。為了描繪一張照片,當IBM最初試圖用 ImageNet-22K 數據集來訓練一個模型時,使用ResNet-101模型,在一臺Power “Minsky” 服務器上,加上4臺英偉達P100 GPU加速器,花費16天。16天的訓練意味著大大延遲了洞察力,以及嚴重阻礙生產力。
IBM稱DDL為“深度學習的噴氣式引擎”—一個吸引人的名字,確實不太離譜。IBM表示,使用DDL技術,能夠在64臺Power “Minsky”服務器上,一共256個英偉達的P100GPU,將相同的流程縮減到7個小時。讓我重申一下:16天縮減到7個小時。如果這些結果精確的話,那么為什么IBM認為它可以真正的改變游戲規(guī)則?在7個小時內,IBM的新的圖像識別準確度33.8%的記錄,超過了微軟在業(yè)界創(chuàng)立的10天精確度29.9%的記錄。為了完成這一切,IBM表示,DDL可以高效擴展,上升到256個GPU,Caffe深度學習框架的效率提升到95%。
測試版已經上線
開發(fā)者不用非要等到嘗試這項新技術。IBM research正在為IBM系統提供一個DDL測試版,IBM系統現在已經發(fā)布了新版本IBM PowerAI (TensorFlow 和 Caffe, Torch 和 Chainer 即將推出)的第四個版本。我認為這將是IBM電源系統的一個重要的補充,他被稱作“瑞士軍刀加速器”—標準PCI Express、CAPI和NVLink標準,都被封裝在一個平臺上。
關于DDL,另外一個需要特別注意的是,它將不僅可以在本地使用,還可以在云端使用—通過云端服務商Nimbix提供。今天的異構環(huán)境,靈活性是顯而易見的。開發(fā)者能夠在Nimbix者在IBM Power系統服務器上,使用測試版本。
總結
很有意思的事情是,這項新技術是來自于IBM,而不是其它如谷歌或者Facebook,這樣更大更響亮的AI組件支持者。看起來,IBM能夠繼續(xù)攜“第一”到桌面上,IBM不僅是企業(yè)領的主要參與者,還在深度學習領域也是。DDL和OpenPOWER是秘密資源—我相信未來將給IBM所需要的結果—大大縮短訓練時間,提高精確度和效率。我認為消除了瓶頸,DDL有潛力去實現打開深度學習的門閘。這對IBM、PowerAI和OpenPOWER是真正改變游戲規(guī)則。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7月8日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數會2025(第六屆)機器人及智能工廠展
-
7月31日免費預約>> OFweek 2025具身智能機器人產業(yè)技術創(chuàng)新應用論壇
-
免費參會立即報名>> 7月30日- 8月1日 2025全數會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
推薦專題