平均交付準(zhǔn)確率99%以上!又一大廠進(jìn)軍自動(dòng)駕駛AI數(shù)據(jù)服務(wù),教AI學(xué)會(huì)人類標(biāo)注能力
用AI數(shù)據(jù)增強(qiáng)汽車“智力”
允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
△AI數(shù)據(jù)是人工智能行業(yè)的燃料,在智能駕駛領(lǐng)域同樣扮演著助推技術(shù)落地的角色
如今自動(dòng)駕駛成為了人工智能領(lǐng)域最受關(guān)注、最具挑戰(zhàn)和影響力最為廣泛的產(chǎn)業(yè)方向,是推動(dòng)全球汽車工業(yè)變革最重要的科技力量。
汽車正在向智能化轉(zhuǎn)變,在自動(dòng)駕駛落地較好的企業(yè)往往也具備強(qiáng)勁的市場(chǎng)競(jìng)爭(zhēng)力。但目前智能汽車想要實(shí)現(xiàn)更高等級(jí)的自動(dòng)駕駛,還有許多技術(shù)難點(diǎn)有待解決。
成熟的自動(dòng)駕駛技術(shù)需要具備感知和決策兩方面能力。
通過(guò)多種融合的車外傳感器使汽車具備感知周圍行駛環(huán)境的能力;決策則是基于感知和理解后的信息給出判斷和建議,再通過(guò)分模塊的方式下達(dá)和完成自動(dòng)駕駛?cè)蝿?wù)。所以對(duì)于周圍信息的判斷和感知能力顯得尤為重要。
事實(shí)上,數(shù)據(jù)、算法、算力被看成人工智能中的“三駕馬車”,數(shù)據(jù)是其中的土壤。
當(dāng)前提升自動(dòng)駕駛感知能力的主要方式是依靠有監(jiān)督學(xué)習(xí)的方法,將大量標(biāo)注過(guò)的數(shù)據(jù)對(duì)算法進(jìn)行“投喂”,通過(guò)不斷地訓(xùn)練,讓模型具備感知能力并達(dá)到一定的識(shí)別準(zhǔn)確率。
近日,ICVS中國(guó)自動(dòng)駕駛年會(huì)召開,在火山引擎 X NVIDIA云上創(chuàng)新專場(chǎng)上,火山引擎首次面向智駕行業(yè)集中展示了AI數(shù)據(jù)服務(wù)的能力,并分享了在構(gòu)建高質(zhì)量、高安全性、高效的數(shù)據(jù)服務(wù)體驗(yàn)上的思路,成為了活動(dòng)上的焦點(diǎn)。
如何靠標(biāo)注提升自動(dòng)駕駛“感知力”?
在路面上行駛的自動(dòng)駕駛車輛每天會(huì)產(chǎn)生大量的數(shù)據(jù),如何管理并標(biāo)注好這些數(shù)據(jù)顯得非常關(guān)鍵。
隨著數(shù)據(jù)標(biāo)注需求量的爆發(fā),簡(jiǎn)單粗暴地堆人力已無(wú)法有效解決“需求波峰”時(shí)供應(yīng)不足的行業(yè)痛點(diǎn)。
針對(duì)這些行業(yè)痛點(diǎn)和需求,火山引擎AI數(shù)據(jù)服務(wù)基于全生命周期的管理作業(yè)平臺(tái),提供一站式的服務(wù)能力體系,包含:售前咨詢、方案設(shè)計(jì)、數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注、調(diào)研測(cè)評(píng)、智能標(biāo)注工具等,幫助企業(yè)解決智能駕駛時(shí)代下的高質(zhì)量數(shù)據(jù)缺口問(wèn)題。
△AI數(shù)據(jù)服務(wù)的一站式服務(wù)能力
火山引擎提供從售前階段到定制化數(shù)據(jù)采集&標(biāo)注服務(wù),有專業(yè)的售前經(jīng)理為客戶提供完整的質(zhì)量把控、數(shù)據(jù)流轉(zhuǎn)、人員等方面的規(guī)劃方案,保證全周期的交付質(zhì)量。
執(zhí)行團(tuán)隊(duì)?wèi){借豐富的采集和標(biāo)注交付經(jīng)驗(yàn),提供覆蓋2D類、3D類、ASR、TTS、NLP等數(shù)據(jù)類型的采標(biāo)服務(wù),靈活地針對(duì)客戶的需求提供定制化的方案。并利用智能化的標(biāo)注工具套件、AI預(yù)標(biāo)注和邊標(biāo)邊訓(xùn)的模式,實(shí)現(xiàn)人機(jī)協(xié)作,有效提升效率、為企業(yè)降低成本。
同時(shí),結(jié)合了先進(jìn)的項(xiàng)目管理經(jīng)驗(yàn)和方法論,逐步形成質(zhì)量進(jìn)度管理、資源管理、技術(shù)工具和數(shù)據(jù)安全四個(gè)支撐方案,最終呈現(xiàn)一套專業(yè)的、一站式的服務(wù)能力體系。
智能駕駛中的兩大標(biāo)注需求
在智能汽車領(lǐng)域中,火山引擎AI數(shù)據(jù)服務(wù)主要針對(duì)自動(dòng)駕駛、智能座艙兩大方向,提供高質(zhì)量的數(shù)據(jù)采集、標(biāo)注服務(wù)。
在自動(dòng)駕駛領(lǐng)域,火山引擎根據(jù)L2級(jí)別組合駕駛輔助,提供對(duì)車道和周圍環(huán)境數(shù)據(jù)的采集和標(biāo)注服務(wù),通過(guò)持續(xù)不斷地投喂高質(zhì)量的數(shù)據(jù),來(lái)提升智能汽車在路面行駛時(shí)對(duì)周圍環(huán)境及物體的感知能力。
針對(duì)L3級(jí)及以上的自動(dòng)駕駛等級(jí),火山引擎借助點(diǎn)云標(biāo)注的大方向,通過(guò)3D點(diǎn)云場(chǎng)景下的連續(xù)幀、2/3D融合、點(diǎn)云語(yǔ)義分割等標(biāo)注類型,解決自動(dòng)駕駛應(yīng)用場(chǎng)景持續(xù)拓展對(duì)于多源異構(gòu)數(shù)據(jù)的需求,數(shù)據(jù)精準(zhǔn)度可達(dá)99%級(jí)別,直擊數(shù)據(jù)需求痛點(diǎn),加速自動(dòng)駕駛算法落地。
在智能座艙領(lǐng)域,通常需要對(duì)車內(nèi)的不同條件下的人臉、手勢(shì)、語(yǔ)音數(shù)據(jù)采集和標(biāo)注,讓智能座駕能夠理解駕駛員的意圖并快速響應(yīng),豐富駕駛樂(lè)趣和使用體驗(yàn)的同時(shí),也能進(jìn)一步增強(qiáng)行駛安全性。
針對(duì)車內(nèi)的生物識(shí)別和手勢(shì)控制識(shí)別技術(shù),火山引擎AI數(shù)據(jù)服務(wù)可提供多種設(shè)備(錄音筆、手機(jī)、車機(jī)魚眼攝像頭等)、多角度(直視、45度、仰視等)、多場(chǎng)景(多場(chǎng)景下的光線條件)下的數(shù)據(jù)采集服務(wù),對(duì)駕駛員眼球視線和人臉輪廓及手勢(shì)進(jìn)行標(biāo)注,用于判斷和識(shí)別駕駛員駕駛狀態(tài)和對(duì)車機(jī)下達(dá)的操控指令,確保機(jī)器訓(xùn)練所用的非結(jié)構(gòu)化數(shù)據(jù)來(lái)源足夠豐富和多樣。
在聲控信息交互和情感交互識(shí)別方面,可提供多語(yǔ)種(普通話、方言、英語(yǔ)等)、多語(yǔ)料、多場(chǎng)景(車內(nèi)、車外、多乘客等)及不同性別、年齡人的語(yǔ)音采集和標(biāo)注能力,用于訓(xùn)練和提升語(yǔ)音喚醒、語(yǔ)音識(shí)別、NLP、情感識(shí)別等模型的效果。
現(xiàn)階段,火山引擎AI數(shù)據(jù)服務(wù)在智能駕駛領(lǐng)域擁有幾千名2D/3D經(jīng)驗(yàn)生產(chǎn)人力,平均交付準(zhǔn)確率已經(jīng)可以實(shí)現(xiàn)99%以上。
客戶已經(jīng)覆蓋頭部互聯(lián)網(wǎng)公司無(wú)人車項(xiàng)目、造車新勢(shì)力、傳統(tǒng)車廠、圖商、自動(dòng)駕駛方案提供商等。
項(xiàng)目能力覆蓋了2D/3D融合、點(diǎn)云車道線、連續(xù)幀追蹤標(biāo)注等主要類型。標(biāo)注車型覆蓋商用車、乘用車及無(wú)人配送車等多類型車輛,標(biāo)注場(chǎng)景實(shí)現(xiàn)全覆蓋。
利用智能化數(shù)據(jù)平臺(tái)提升標(biāo)注效率
當(dāng)前,許多數(shù)據(jù)標(biāo)注企業(yè)仍停留在勞動(dòng)密集型產(chǎn)業(yè)的定位中,在面對(duì)現(xiàn)階段自動(dòng)駕駛所需要處理的巨量數(shù)據(jù)時(shí),就顯得捉襟見(jiàn)肘。
從趨勢(shì)上來(lái)看,行業(yè)正在向AI輔助+精細(xì)化管理的方向轉(zhuǎn)變。
通過(guò)AI輔助標(biāo)注算法的升級(jí),減少人力、提升標(biāo)注效率,是未來(lái)數(shù)據(jù)標(biāo)注創(chuàng)新的路徑之一。需要大規(guī)模堆人力的魔咒,正在不斷被技術(shù)所打破。
一款好用的平臺(tái)可以實(shí)現(xiàn)數(shù)據(jù)全流程可視化的管理、質(zhì)檢模式可多層次靈活配置、針對(duì)復(fù)雜任務(wù)可執(zhí)行數(shù)據(jù)串行并行流轉(zhuǎn),能夠保證多個(gè)項(xiàng)目在平臺(tái)實(shí)現(xiàn)一體化作業(yè)。
作為數(shù)據(jù)標(biāo)注的集大成者,火山引擎數(shù)據(jù)標(biāo)注平臺(tái)中集成了多種標(biāo)注模板、預(yù)標(biāo)注與邊標(biāo)邊訓(xùn)算法,同時(shí)具有保障數(shù)據(jù)安全、平臺(tái)操作便捷、可定制化、可與火山引擎云產(chǎn)品打通的特性。
通過(guò)模版工具豐富多樣、人工與算法靈活配合、數(shù)據(jù)服務(wù)專業(yè)高效靈活將持續(xù)為客戶的數(shù)據(jù)處理工作保駕護(hù)航。
△火山引擎數(shù)據(jù)標(biāo)注平臺(tái)的優(yōu)勢(shì)
另外,平臺(tái)支持系統(tǒng)部署到企業(yè)自有服務(wù)器上,企業(yè)的所有系統(tǒng)數(shù)據(jù)均在自主管理下,私密數(shù)據(jù)的安全性有保障。
同時(shí)還可根據(jù)企業(yè)自身需求與業(yè)務(wù)場(chǎng)景,定制個(gè)性化產(chǎn)品方案,讓產(chǎn)品更好地被企業(yè)使用,實(shí)現(xiàn)業(yè)務(wù)發(fā)展與標(biāo)注需求的一比一完美適配。
在標(biāo)注工具方面,實(shí)現(xiàn)了對(duì)各類常見(jiàn)的文本、圖像、視頻、語(yǔ)音、3D點(diǎn)云數(shù)據(jù)的自定義處理需求,降低了模板冗余,幫助客戶快速獲取低成本、高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)。
在算法賦能方面,火山引擎的數(shù)據(jù)標(biāo)注平臺(tái)的AI預(yù)標(biāo)注與邊標(biāo)邊訓(xùn)的算法能力,大幅提高了標(biāo)注效率與準(zhǔn)確率,可輔助和代替部分人工操作,并根據(jù)項(xiàng)目類型,選擇適合的模型能力在相應(yīng)項(xiàng)目階段接入。
△標(biāo)注平臺(tái)的模型能力
模型過(guò)濾階段:由模型進(jìn)行原始數(shù)據(jù)的分析,過(guò)濾掉不需要人工標(biāo)注的數(shù)據(jù),只留下需要人工標(biāo)注的數(shù)據(jù)。
模型預(yù)標(biāo)階段:用模型進(jìn)行數(shù)據(jù)的預(yù)先標(biāo)注,標(biāo)注員只需進(jìn)行確認(rèn)或修改。
模型糾錯(cuò)階段:在標(biāo)注作業(yè)時(shí),模型可以實(shí)時(shí)進(jìn)行智能糾錯(cuò),避免標(biāo)注員提交低質(zhì)量任務(wù)。
模型質(zhì)檢環(huán)節(jié):在質(zhì)檢作業(yè)時(shí),模型可以輔助篩選需重點(diǎn)質(zhì)檢任務(wù)或直接完成數(shù)據(jù)的驗(yàn)收。
火山引擎利用邊標(biāo)邊訓(xùn)的數(shù)據(jù)標(biāo)注模型,智能化地學(xué)習(xí)作業(yè)內(nèi)容與標(biāo)注尺度,通過(guò)“自學(xué)習(xí)”方式驅(qū)動(dòng)完成算法迭代,“智能+無(wú)感知”地學(xué)習(xí)人工標(biāo)注習(xí)慣,帶來(lái)更高的準(zhǔn)確率和更好的數(shù)據(jù)標(biāo)注體驗(yàn)。
在接到長(zhǎng)周期、大批量類型項(xiàng)目時(shí),模型偏向于“特定業(yè)務(wù)類型”,高準(zhǔn)確率帶來(lái)更高的人效收益;在處理短周期、小批量類型項(xiàng)目時(shí),系統(tǒng)可快速切入并賦能業(yè)務(wù),節(jié)省前期人工準(zhǔn)備的時(shí)間。最終可實(shí)現(xiàn)30%-100%的效率提升和10%-30%的質(zhì)量提升。
在業(yè)務(wù)快速發(fā)展的當(dāng)下,AI數(shù)據(jù)服務(wù)業(yè)務(wù)對(duì)工時(shí)精細(xì)化管理的需求愈發(fā)迫切。
△工時(shí)管理平臺(tái)
為了更好的服務(wù)業(yè)務(wù),火山引擎還推出工時(shí)管理系平臺(tái)。該管理平臺(tái)將實(shí)現(xiàn)工時(shí)精細(xì)化管理,推進(jìn)工時(shí)管理系統(tǒng)化進(jìn)程,提高工時(shí)數(shù)據(jù)的準(zhǔn)確性,為高效實(shí)現(xiàn)項(xiàng)目工時(shí)管理和人效管理提供有力支持。
提升數(shù)據(jù)安全管理能力
高質(zhì)量的數(shù)據(jù)產(chǎn)品往往離不開高質(zhì)量的運(yùn)營(yíng)管理體系。
在產(chǎn)品質(zhì)量方面,火山引擎通過(guò)高標(biāo)準(zhǔn)的人員準(zhǔn)入門檻、長(zhǎng)時(shí)間的經(jīng)驗(yàn)累積和方法沉淀、專業(yè)的質(zhì)檢把關(guān)部門、靈活的平臺(tái)支持把控質(zhì)量。
在保證產(chǎn)品質(zhì)量的同時(shí),火山引擎數(shù)據(jù)服務(wù)的產(chǎn)量也值得稱贊,覆蓋全國(guó)支持大規(guī)模量產(chǎn)。
△產(chǎn)量管理
在數(shù)據(jù)標(biāo)注這個(gè)領(lǐng)域,產(chǎn)量是一個(gè)比較重要的課題,為了能保證高效、高產(chǎn),火山引擎AI數(shù)據(jù)服務(wù)在三方面做了一個(gè)相應(yīng)的配置。
在資源層面,在天津、龍巖、重慶、煙臺(tái)等10+地方擁有自建基地,綜合標(biāo)注人員達(dá)萬(wàn)人,可解決人力缺口問(wèn)題。
在人員管理層面,構(gòu)建了完整的人員管理、人員產(chǎn)能分析體系,實(shí)現(xiàn)靈活、敏捷、大規(guī)模用工的新模式。
在平臺(tái)支持層面,資源管理平臺(tái)科學(xué)分發(fā)任務(wù)、進(jìn)度看板提前預(yù)警。通過(guò)增強(qiáng)三方面的能力,能夠以多維度、多角度、科學(xué)精準(zhǔn)地做好產(chǎn)量管控。
近些年數(shù)據(jù)安全問(wèn)題凸顯,企業(yè)對(duì)數(shù)據(jù)的質(zhì)量管控、安全管理及隱私保護(hù)等方面也有較大的訴求,如何最大限度地保障數(shù)據(jù)資產(chǎn)安全成為了重點(diǎn)課題。
△數(shù)據(jù)安全管理
為了預(yù)防數(shù)據(jù)安全問(wèn)題出現(xiàn),火山引擎AI數(shù)據(jù)服務(wù)從人員培訓(xùn)、平臺(tái)安全、工區(qū)場(chǎng)地安全再到網(wǎng)絡(luò)及終端安全都采用了行業(yè)內(nèi)最高標(biāo)準(zhǔn),確??蛻舻暮诵睦娌皇軗p。
在數(shù)據(jù)流轉(zhuǎn)的過(guò)程中,提供云鏈接加密傳輸、硬盤傳送、專人監(jiān)督運(yùn)送、閱后即焚、文檔權(quán)限管理等方式來(lái)保證安全性。
在人員培訓(xùn)、數(shù)據(jù)平臺(tái)、物理工區(qū)、網(wǎng)絡(luò)終端安全等方面,通過(guò)一系列科學(xué)的方式和培訓(xùn)來(lái)提高人員對(duì)數(shù)據(jù)安全保護(hù)意識(shí);再通過(guò)數(shù)據(jù)平臺(tái)水印、飛書文檔權(quán)限、數(shù)據(jù)生命周期和行為記錄等方式確保數(shù)據(jù)不外傳;在物理場(chǎng)地采用門禁、CCTV和專人巡檢的方式保障職場(chǎng)安全;并采用抖音集團(tuán)的網(wǎng)絡(luò)及終端安全管理方法來(lái)保證數(shù)據(jù)安全。
用AI數(shù)據(jù)增強(qiáng)汽車“智力”
算法、算力、數(shù)據(jù)作為AI核心三要素,相互影響,相互支撐,人工智能技術(shù)正在智能汽車行業(yè)內(nèi)形成突破與快速落地,煥發(fā)出了源源不斷的生機(jī)。
自動(dòng)駕駛技術(shù)的問(wèn)世,讓人們構(gòu)想出的“智慧交通再無(wú)擁堵”的概念離我們的距離越來(lái)越接近。
而要實(shí)現(xiàn)真正的自動(dòng)駕駛不是一蹴而就的,它會(huì)經(jīng)歷一段漸進(jìn)的過(guò)程,整個(gè)過(guò)程是從低速到高速,從人機(jī)共駕到無(wú)需駕駛員介入,從有一定風(fēng)險(xiǎn)到零事故發(fā)生,從商用到民用的漸進(jìn)路線。
在自動(dòng)駕駛算法模型逐步走向成熟,車端平臺(tái)大算力普及的今日,數(shù)據(jù)規(guī)模自然而然地成為決定自動(dòng)駕駛能力高低的關(guān)鍵變量,自動(dòng)駕駛技術(shù)的落地離不開大規(guī)模高質(zhì)量數(shù)據(jù)的支持。
數(shù)據(jù)規(guī)模、數(shù)據(jù)獲取成本、數(shù)據(jù)質(zhì)量直接和自動(dòng)駕駛能力提升的速度和高度相關(guān)。隨著高質(zhì)量數(shù)據(jù)資源的積累,智能汽車將愈加智慧,智能駕駛體驗(yàn)愈發(fā)出色,圍繞用戶全生命周期的商業(yè)化模式也將愈發(fā)清晰。
AI數(shù)據(jù)服務(wù)負(fù)責(zé)人金亮表示:
當(dāng)前,AI算法對(duì)訓(xùn)練數(shù)據(jù)維度和樣本復(fù)雜性的要求變得越來(lái)越高,對(duì)數(shù)據(jù)標(biāo)注技術(shù)、標(biāo)注平臺(tái)能力、數(shù)據(jù)安全、不同維度數(shù)據(jù)協(xié)同標(biāo)注等都提出了挑戰(zhàn)。
面對(duì)新挑戰(zhàn),火山引擎AI數(shù)據(jù)服務(wù)利用AI技術(shù)對(duì)海量圖像及點(diǎn)云數(shù)據(jù)進(jìn)行難例提取和場(chǎng)景挖掘,結(jié)合AI自動(dòng)化預(yù)標(biāo)注和輔助標(biāo)注,輔以交互式人工標(biāo)注和質(zhì)量控制措施,將有效降低數(shù)據(jù)標(biāo)注復(fù)雜度,提升整體數(shù)據(jù)質(zhì)量,最終解決自動(dòng)駕駛模型訓(xùn)練的痛點(diǎn),快速地部署AI。