AI探險日記:乘上星際飛船探索AI宇宙
此外,飛槳的工程師建議,因為采集端只有一路視頻,所以,后端處理業(yè)務要既保證性能穩(wěn)定性,又能兼顧將來業(yè)務擴展,疊加更多的智能分析功能。新的設備上線后,每日3公里巡檢2次,單次僅僅能積累約200張圖片素材,為了提高識別精度和更多數(shù)據(jù)的訓練積累,飛槳工程師建議對于巡檢點的視頻進行截圖回傳,這樣可以增加數(shù)據(jù),再結合自動和人工標注加入訓練集,提高識別效率。
“在飛槳的幫助下,我們全流程學習了一次AI的實施落地。我們發(fā)現(xiàn),飛槳的一大優(yōu)點就是開發(fā)部署的學習難度很低,即使我們的工程師經驗并不豐富,但由于飛槳的開發(fā)套件成熟度高,實際上比我們預料的上線時間縮短70%以上,這大大的增加了我們以后進一步利用AI來改造設備的勇氣。我們希望把那些單價上億的自動采煤機,都通過百度的AI升級成智能機器人”,高強博士說:“以前我們說自己是一家機器人公司,但現(xiàn)在我們可以說自己是一家智能機器人公司,兩字之差,跨越了一個時代!”
事實上,這種團隊規(guī)模中等、有一定技術底蘊的團隊,比之前文所說的“先行者模式”,更容易接受像開發(fā)套件這樣的“重武器”,從而提升整體戰(zhàn)斗力,從一個“工作坊”變成企業(yè)的AI發(fā)動機。
但并不是每個“工作坊”都有完備的團隊,吳甜回憶過一個工業(yè)企業(yè)的AI落地情景,當初接洽時,初步了解到對方已經有一支12人的隊伍,覺得大有希望——這是典型的“工作坊”式團隊啊。
然而,經過實際接觸才發(fā)現(xiàn),這個12個人的AI團隊,只有1名AI專業(yè)研發(fā)人員能夠理解深度學習算法的大致原理,并且達到了能自己動手使用飛槳算法類套件進行深度學習算法訓練的程度。
如何最快的讓這些沒有AI背景、甚至沒有計算機背景的工程師能夠在AI研發(fā)中形成合力?顯然,從頭學習是不現(xiàn)實的,而必須有工具。
被稱為產業(yè)級深度學習平臺的飛槳,之所以能夠異軍突起,在短短5年的時間內,在中國深度學習平臺的市場綜合份額上超過谷歌和Facebook,靠的就是和中國產業(yè)界的高度適配。
就拿剛才的問題來說,同一支團隊、不同背景、不同經驗甚至不同悟性,飛槳都準備了不同的工具。通過模型研發(fā)深度的階梯式、多層次產品,來應對企業(yè)團隊中人員背景多樣的問題。
在一次論壇分享中,吳甜自信的說:“無論企業(yè)研發(fā)團隊中的能力和經驗如何,總能在飛槳平臺上找到一種當前適用的產品形態(tài),并可以不斷學習精進,逐漸攀升使用更靈活更自主的產品!
簡單來說,飛槳平臺就相當于一個巨大的模型工廠,能直接基于框架開發(fā)模型的AI工作者,是最高階的,相當于米其林的三星級大廚。
僅僅有“工廠”還不夠,還得有具體的“產品線”,這其中,又可以分為場景類開發(fā)套件和算法類開發(fā)套件,來適配不同的應用環(huán)境,能夠運用開發(fā)套件的,也是AI應用人員中的行家里手。
當然,對于AI基礎薄弱的人員,尤其是沒有系統(tǒng)的學過編程的人員來說,最便捷的方式就是無代碼的開發(fā)方式。同樣以“模型工廠”里的大量模型為從基礎,飛槳提供了前面介紹過的EasyDL。你可以理解為像使用美圖秀秀這樣簡單,只要做一些拖拽、填寫一些參數(shù)、上傳一些數(shù)據(jù),甚至不用寫一行代碼,就可以快速上手AI開發(fā),吳甜曾稱之為“讓大家找找AI開發(fā)的感覺”。
為了包容不同類型的開發(fā)者,飛槳在便利性上做足功夫。
飛槳封裝隱藏了編譯自定義算子過程中不必要的框架底層概念,并且打通了訓練和推理體系,這樣就可以讓更多非AI專業(yè)人員通過飛槳平臺更靈活、更簡單地在自己的領域應用深度學習技術。
言歸正傳,說到前面那支背景多樣的團隊,在百度飛槳和團隊帶頭人的持續(xù)幫助下,能力有了全面的提升,使得團隊的技術結構已經發(fā)生了變化——有人能使用飛槳可視化界面開發(fā),有人能使用場景化套件,一些人甚至擁有了應用配置化開發(fā)的算法類套件深入進行深度學習算法的開發(fā)的能力,而這支團隊的成長,就是處在AI工作坊階段并不斷進階的一個AI團隊的縮影。
但這,也不過是飛槳的探險之旅中的一個環(huán)節(jié)。
3
乘上星際飛船,探索AI宇宙
說起AI進入工業(yè)大生產,人們一定非常興奮,腦中一定會出現(xiàn)非常壯麗的圖景,但在實際落地中,這種工作的組織難度是非常高的。
以一個大型的互聯(lián)網企業(yè)為例, 有涉及視覺、語音、推薦等數(shù)百個AI場景建模的需求,有應用開發(fā)、算法調優(yōu)、平臺開發(fā)等多種類型的AI研發(fā)工作,有MPI、機器學習和深度學習等數(shù)千并發(fā)任務,整個企業(yè)用了近十年向AI底座遷移,這才是真正的工業(yè)大生產。
而參與項目的技術人員、使用這些服務的企業(yè)員工,數(shù)量高達數(shù)千;在資源上,這些任務需要GPU、CPU、FGPA等異構計算的數(shù)萬張卡,可謂是波瀾壯闊。
“這種多人多任務高并發(fā)度協(xié)同,是最考驗平臺能力的,因為它不僅是一個工程問題,更是一個工程管理問題,它考驗飛槳能否幫助AI在一個龐大體系落地的能力和效率,這是目前步入AI工業(yè)大生產的‘入門考試’!痹谝淮喂_論壇中,吳甜這樣形容。
而面對這樣復雜的需求,飛槳開展了兩方面的核心工作來支持,一類是面向資源算力層面,項目需要高效的算力管理與調度,以應對大規(guī)模AI應用時需要的算力基礎設施提供、管理、調度等。
為此,飛槳構建了作業(yè)及工作流調度系統(tǒng),從這個角度來看,再次顯現(xiàn)了飛槳的“產業(yè)級”特性,那就是能夠支持大量并行任務同時開展,對模型和服務進行了科學有序的管理,提升整體的研發(fā)效率。
這樣的大型項目中,很多都是基于人工智能的通用模型打造,而一般來說,打造一個通用模型直到它成熟,需要許許多多次的嘗試——很多通用模型在設計的時候其實都是一次對于資源的冒險,需要調動成千上萬的GPU。
而飛槳在這樣的大場景中解決的,就常常包含去嘗試不同的超大模型,并通過卓越的泛化能力,再產生出更多個適用不同場景的更優(yōu)化的小模型,我們可以把飛槳看做是“用AI生產出AI的體系”,它是AI的工作母機,是人類探索AI的星際飛船。
而正是因為飛槳不斷的嘗試這樣的大場景、通用模型和泛化,所以,對于飛槳產品(模型)已經完善的場景,或者有一定研發(fā)能力的企業(yè),企業(yè)中的AI團隊在飛槳產品的輔助下就可以獨立完成很多出色的應用項目,而且速度越來越快。
這其實就涉及到人們熱衷于討論的一個問題,對于越來越分散的場景,是不是需要無限的投入人力資源去定制服務,答案顯然并非全部如此,飛槳的選擇就是通過不斷挑戰(zhàn)大場景,不斷的進行模型優(yōu)化,使得模型的通用性越來越強,再配合以各種專用的套件,就能不斷加速AI落地的速度。
例如,百度飛槳的合作伙伴里,就有專門生產AI產品及應用解決方案的企業(yè),有一個企業(yè),就基于Paddle Detection目標檢測套件中的YOLOv2算法,打造了適用于煉鋼廠的鋼坯位置的檢測方案。在這個項目中,由于PaddleDetection已經趨于成熟,企業(yè)團隊成員能力較強,整體過程比較順利,基本沒遇到什么問題。而且,當下次、下下次遇到類似的鋼坯檢測問題時,部署的速度會十倍、百倍的提升,這就是一個能夠用數(shù)據(jù)沉積智慧、經驗和模型,從而不斷自我完善的閉環(huán),它們才是通向大工業(yè)時代真正的底層引擎。
如果說這篇文章僅僅是從AI落地的角度解讀AI從先行者階段向工業(yè)大生產時代的邁進,那它還是不夠全面的,因為AI落地不僅僅取決于以上的技術、工程、管理方面的要素,它還需要更大體系的支持。
其中,人才的培養(yǎng)是非常重要的。雖然我們看到,很多工程師都可以邊學邊干,在實踐中培養(yǎng)AI能力,但這不能掩蓋我國AI人才嚴重缺乏的現(xiàn)實。而且,這種缺乏是全面的,從開創(chuàng)性的領軍人物到最基層的用無代碼開發(fā)工具的應用人才,都有巨大的缺口。
為此,飛槳非常重視復合型AI人才培養(yǎng)的工作,始終在輸出業(yè)務、算法、工程三位一體的人才培養(yǎng)理念,強調跨越邊界,學以致用。當前已經建立起成熟完善的產業(yè)級復合型AI人才培養(yǎng)體系,包括面向一線算法工程師的“AI快車道”,面向技術負責人的“AI私享會”和面向CTO、架構師層級的“AICA首席AI架構師培養(yǎng)計劃”等等。
生態(tài)的建立也至關重要。飛槳是一個平臺級的存在,平臺有平臺的優(yōu)勢,也有平臺的劣勢,特別是針對垂直場景和分散化的場景。
吳甜在多次對外溝通中反復強調,AI落地應用勢必是要面對分散化的場景需求,如何在業(yè)務場景中發(fā)現(xiàn)問題、解決問題需要懂得業(yè)務邏輯的人學會結合AI技術,飛槳豐富的產品體系能夠滿足不同要求和特點的使用者,例如前面提到的零代碼可視化界面客戶端、場景類開發(fā)套件、算法類開發(fā)套件、模型庫、深度學習框架。
此外,飛槳還提供了企業(yè)級的平臺型產品BML,發(fā)布了首個易被集成的云原生機器學習核心系統(tǒng)PaddleFlow,可以為企業(yè)的AI平臺開發(fā)者提供資源管理調度等核心能力,賦能更多細分場景和深度定制的AI平臺,同時解決企業(yè)AI研發(fā)協(xié)作效率的問題。
但從更長遠的角度看,飛槳應該有更多生態(tài)伙伴,就像我們前面提到的,為企業(yè)提供AI產品和方案的公司,基于飛槳進行豐富多樣的AI生產創(chuàng)造,協(xié)同加速千行百業(yè)的智能化升級。

請輸入評論內容...
請輸入評論/評論長度6~500個字