這家自動(dòng)駕駛公司共標(biāo)記了2億英里的行駛數(shù)據(jù),他們希望業(yè)內(nèi)能數(shù)據(jù)共享
總部位于舊金山的Scale公司是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,近日他們拿到了千萬(wàn)美元的B輪投資,Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 都是他們的客戶,Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),而他們希望將數(shù)據(jù)開源。
隨著機(jī)器視覺、人臉識(shí)別、語(yǔ)言處理與大數(shù)據(jù)分析等技術(shù)的日臻成熟,出行生態(tài)不斷智能化。計(jì)算機(jī)視覺為自動(dòng)駕駛汽車點(diǎn)亮了眼睛,通過(guò)視覺感知,無(wú)人車可以標(biāo)注并識(shí)別出車輛、車道線以及行人動(dòng)物等。當(dāng)一臺(tái)計(jì)算機(jī)學(xué)習(xí)而不標(biāo)記的訓(xùn)練數(shù)據(jù),它被稱為無(wú)監(jiān)督學(xué)習(xí)。計(jì)算機(jī)通過(guò)無(wú)人監(jiān)督的學(xué)習(xí)得到正確的答案,但它需要很長(zhǎng)時(shí)間需要訓(xùn)練大量的數(shù)據(jù)才能達(dá)到識(shí)別的效果。而當(dāng)計(jì)算機(jī)用標(biāo)記的訓(xùn)練數(shù)據(jù)學(xué)習(xí)時(shí),被稱為監(jiān)督學(xué)習(xí),比如標(biāo)記數(shù)據(jù)是貓的圖像,同時(shí)會(huì)將單詞“cat”作為元數(shù)據(jù)附加到其圖像上,這種方法極大地加速了學(xué)習(xí)過(guò)程。
創(chuàng)建標(biāo)記的訓(xùn)練數(shù)據(jù)的過(guò)程已經(jīng)成為一個(gè)重要且成本高昂的業(yè)務(wù),國(guó)內(nèi)外也有很多創(chuàng)業(yè)公司在做相關(guān)的服務(wù),但這些標(biāo)記數(shù)據(jù)集來(lái)自哪里?
今天的大多數(shù)標(biāo)注數(shù)據(jù)都是人類注釋的,成千上萬(wàn)的圖像都是由人工標(biāo)記的,這是一個(gè)非常緩慢而低效的過(guò)程。它需要人坐在計(jì)算機(jī)屏幕前操作注釋器,點(diǎn)擊圖像,逐個(gè)標(biāo)記它們。并且,隨著圖像數(shù)量的增加,這個(gè)過(guò)程會(huì)變得更加昂貴且容易出錯(cuò)。
總部位于舊金山的Scale公司正是向自動(dòng)駕駛車輛制造商提供傳感器融合標(biāo)注API(Sensor Fusion Annotation API)的供應(yīng)商,以加速數(shù)據(jù)標(biāo)記處理。該公司由麻省理工學(xué)院(MIT)的21歲計(jì)算機(jī)科學(xué)家Alexandr Wang于2016年創(chuàng)立。
Scale的最初目標(biāo)是擴(kuò)展標(biāo)記訓(xùn)練數(shù)據(jù)的過(guò)程。解決這個(gè)問題共分為兩個(gè)部分:一個(gè)是編組成千上萬(wàn)人工標(biāo)記數(shù)據(jù)的任務(wù);第二個(gè)是創(chuàng)建一套復(fù)雜的工具,使這些貼標(biāo)機(jī)的效率和準(zhǔn)確度提高了10倍。Alexandr 和他的團(tuán)隊(duì)在創(chuàng)辦兩年來(lái),組建了一支由工程師和技術(shù)人員組成的世界級(jí)技術(shù)團(tuán)隊(duì),正在改變這一領(lǐng)域。當(dāng)?shù)貢r(shí)間8月7日,Scale宣布其融得了由Index Ventures、Accel和Y Combinator領(lǐng)投的1800萬(wàn)美金。
Scale結(jié)合使用了人工數(shù)據(jù)標(biāo)記員和機(jī)器學(xué)習(xí)算法,對(duì)來(lái)自Lyft、通用汽車(General Motors)、Zoox、Voyage、nuTonomy和 Embark 等客戶的原始、未標(biāo)記的數(shù)據(jù)進(jìn)行分類,然后以可擴(kuò)展數(shù)據(jù)集的方式返還。該公司的員工負(fù)責(zé)審查來(lái)自汽車的圖像、雷達(dá)、激光雷達(dá)數(shù)據(jù)(以及其他傳感器數(shù)據(jù)),確保自動(dòng)駕駛車輛能夠正確識(shí)別道路上的行人、騎自行車車手以及其他物體,并且根據(jù)需要進(jìn)行修正。Scale的系統(tǒng)目前一共已經(jīng)標(biāo)記了200,000,000英里的自動(dòng)駕駛車輛的行駛數(shù)據(jù),并且最近將其工作擴(kuò)展道路機(jī)器人、無(wú)人機(jī)、虛擬助手以及嚴(yán)重依賴AI的“其他解決方案”。
Scale API如何訓(xùn)練自主車輛
這家初創(chuàng)公司開發(fā)了自動(dòng)化系統(tǒng),可以從自動(dòng)駕駛汽車看到的內(nèi)容中獲取數(shù)據(jù)并對(duì)其進(jìn)行檢查來(lái)標(biāo)記必要的實(shí)物。創(chuàng)建標(biāo)簽的過(guò)程有助于自動(dòng)駕駛汽車內(nèi)的軟件學(xué)會(huì)識(shí)別特定場(chǎng)景,以便更好地為未來(lái)做好準(zhǔn)備。
Scale 針對(duì)圖像推出一系列注釋類型,其發(fā)布的傳感器融合標(biāo)注API(Sensor Fusion Annotation API),能夠支持所有主流傳感器的高級(jí)3D感知,包括激光雷達(dá)(30米內(nèi)稠密3D場(chǎng)景理解)、相機(jī)(70米內(nèi)圖像目標(biāo)識(shí)別)和Radar(150米內(nèi)稀疏場(chǎng)景理解),以幫助汽車制造商和自動(dòng)駕駛汽車公司加速感知算法的開發(fā)。
在Scale中,提供圖像注釋服務(wù)之一是Cuboid Annotation,它使用包圍汽車,卡車,行人,交通錐等物體的長(zhǎng)方體投影來(lái)注釋二維圖像。通過(guò)一些附加信息,可以將這些二維框注釋轉(zhuǎn)換為完整的三維框,包括高度,寬度,深度,旋轉(zhuǎn)和相對(duì)定位信息。
目前其社區(qū)推出的標(biāo)簽類型主要有:
像素方式語(yǔ)義分割
多邊形注釋
點(diǎn)注釋
行注釋
像素方式語(yǔ)義分割
像素方式語(yǔ)義分割
多邊形注釋
線注釋
另外,Scale API還提供用于OCR和圖像轉(zhuǎn)錄、分類、比較和數(shù)據(jù)收集的API。
RADAR在150米范圍內(nèi)探測(cè)場(chǎng)景的屏幕截圖
借助傳感器融合標(biāo)注API,用戶可以上傳未標(biāo)記的相機(jī)、激光雷達(dá)和Radar數(shù)據(jù),生成可用于訓(xùn)練3D感知模型的標(biāo)注數(shù)據(jù)。激光雷達(dá)和Radar標(biāo)注是指,采用長(zhǎng)方體包圍特定對(duì)象的3D點(diǎn)云,并得到這些框的位置和大小。該API支持所有用于3D感知的主流傳感器,為自動(dòng)駕駛技術(shù)提供數(shù)據(jù)支持。
手動(dòng)立方體注釋
除了注釋二維圖像,Scale公司也同通過(guò)手工注釋立方體。通過(guò)手動(dòng)立方體調(diào)整,縮放器只需繪制一個(gè)2D框,表示長(zhǎng)方體的一側(cè)和長(zhǎng)方體的另一側(cè):
這通常不是一個(gè)“真正的”長(zhǎng)方體,因?yàn)樗跀?shù)學(xué)上是不精確的!罢嬲摹遍L(zhǎng)方體的正面可能不是一個(gè)完美的90度矩形,特別是如果它沒有正面朝向相機(jī)。通過(guò)調(diào)整,給定上面的長(zhǎng)方體注釋,以及一些附加信息(即相機(jī)參數(shù)和方向),會(huì)自動(dòng)生成更準(zhǔn)確的注釋:
正面不再是完美的矩形,而是梯形,左邊緣略小,更好地反映了汽車相機(jī)的相對(duì)方向。右側(cè)的頂部/底部邊緣現(xiàn)在會(huì)聚合到地平線上的一個(gè)點(diǎn)。從3D空間中的這八個(gè)點(diǎn)可以很容易地推斷出所得長(zhǎng)方體的位置,尺寸和方向。通過(guò)這些屬性,人們可以訓(xùn)練模型,從單個(gè)圖像中預(yù)測(cè)類似長(zhǎng)方體的物體的3d坐標(biāo)。通過(guò)這種方式,可以創(chuàng)建一個(gè)系統(tǒng),僅需要使用Scale API生成的攝像機(jī)圖像和注釋來(lái)識(shí)別世界上汽車的位置。
Scale倡導(dǎo)數(shù)據(jù)共享
顯然,標(biāo)記是Scale API的重要業(yè)務(wù)組成部分。正如Wired指出的那樣,錯(cuò)誤地將行人標(biāo)記為車輛可能會(huì)使自動(dòng)駕駛汽車的軟件混淆到不斷出錯(cuò)的程度,甚至可能導(dǎo)致事故。Scale已經(jīng)將標(biāo)簽作為開發(fā)自動(dòng)駕駛汽車的必要和不可或缺的一部分。 不幸的是,標(biāo)簽不會(huì)彼此共享。Scale的客戶群包括Cruise,Nuro,Lyft,Zoox,Nutonomy,Starsky Robotics和Embark都將數(shù)據(jù)發(fā)送到Scale這里。但是,這些數(shù)據(jù)并沒有相互分享,這是一種資源的浪費(fèi)。自動(dòng)駕駛汽車需要使用更多真實(shí)的標(biāo)記數(shù)據(jù)集測(cè)試來(lái)保證不穩(wěn)定的情況。所以,Scale希望數(shù)據(jù)能夠共享,構(gòu)建更廣泛的數(shù)據(jù)集。
21歲的創(chuàng)始人兼首席執(zhí)行官Alexandr Wang 認(rèn)為“現(xiàn)在,每家公司都在自己的道路上并且保密自己的數(shù)據(jù),實(shí)際上,這些邊緣情況可能需要在整個(gè)行業(yè)中共享或標(biāo)準(zhǔn)化!
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【在線研討會(huì)】普源精電--激光原理應(yīng)用與測(cè)試解決方案
-
精彩回顧立即查看>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
- 1 從技術(shù)狂歡到安全合規(guī) :2025上半年自動(dòng)駕駛?cè)谫Y進(jìn)入“場(chǎng)景閉環(huán)”新周期
- 2 飛行汽車:開啟規(guī);囷w
- 3 誰(shuí)在為智駕買單?城市NOA滲透背后的用戶分析
- 4 汽車抬頭顯示的智能化旅程
- 5 最嚴(yán)輔助駕駛新規(guī),兩部門再劃監(jiān)管、宣傳紅線
- 6 智駕技術(shù)戰(zhàn):特斯拉、華為、理想、小鵬和比亞迪,誰(shuí)才是未來(lái)?
- 7 奧迪A5L Sportback全新登場(chǎng),上市亮點(diǎn)探秘
- 8 自動(dòng)駕駛RoboTaxi“闖五關(guān)”:混合運(yùn)營(yíng)才能扛起商業(yè)化大旗?蘿卜快跑、小馬智行、文遠(yuǎn)知行、特斯拉、Waymo怎么選?
- 9 道通科技,全球汽車診斷市場(chǎng)龍頭
- 10 百度蘿卜快跑:從北大嶼山到香港島:自動(dòng)駕駛在香港的 “三級(jí)跳” 啟示錄