“更好的數(shù)據(jù)意味著更好的決策”。這句話如今被越來越多智能駕駛領(lǐng)域人士提及和認(rèn)可。
讓汽車具備“智慧”,智能駕駛成為全球許多國家都在關(guān)注的一個(gè)重要課題。而在這一過程中,AI數(shù)據(jù)對于汽車智能駕駛而言至關(guān)重要,它是汽車變得更“聰明”的關(guān)鍵。
然而,關(guān)于智能駕駛引發(fā)的事故我們也已經(jīng)看到太多,這些教訓(xùn)也在告誡我們,我們需要更加安全的智能駕駛,需要更多精準(zhǔn)的數(shù)據(jù)為安全保駕護(hù)航,能夠在汽車感知、規(guī)劃、決策、控制方面進(jìn)行指揮,才是真正的人工智能。
在汽車智能駕駛的過程中,汽車本身需要具備感知、策劃、決策、控制等一些列能力,而數(shù)據(jù)則是培養(yǎng)智能駕駛AI能力的重要因素,數(shù)據(jù)標(biāo)注存在的意義是讓機(jī)器理解并認(rèn)識世界,想要讓汽車本身的算法做到處理更多、更復(fù)雜的場景,背后就需要有海量的真實(shí)道路場景數(shù)據(jù)做支撐。
算力、算法方興未艾:高質(zhì)量數(shù)據(jù)成產(chǎn)業(yè)落地著力點(diǎn)
數(shù)據(jù)、算力、算法是推動人工智能技術(shù)進(jìn)步的“三駕馬車”。如今,在計(jì)算機(jī)視覺、語音識別領(lǐng)域,AI的商業(yè)化落地突破并不明顯,原因就在于算法算力的技術(shù)瓶頸。
從宏觀角度來看,現(xiàn)有算法、算力無法準(zhǔn)確處理復(fù)雜環(huán)境下無限可能的長尾場景,這時(shí)候AI數(shù)據(jù)的覆蓋就顯得更加重要。
我們看到,在現(xiàn)有的算法算力的基礎(chǔ)上,越來越多的AI進(jìn)化方式是通過對大量的原始數(shù)據(jù)進(jìn)行框選、提取、分類,從而將復(fù)雜的原始數(shù)據(jù)標(biāo)簽化,轉(zhuǎn)為機(jī)器學(xué)習(xí)可以識別的精準(zhǔn)數(shù)據(jù),以提升AI的感知能力。
對于智能駕駛技術(shù)而言,這樣的數(shù)據(jù)精確化顯得更為重要:一方面,現(xiàn)實(shí)交通場景復(fù)雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷。尤其是國內(nèi)路況的復(fù)雜性和國內(nèi)智能駕駛起步稍晚的現(xiàn)狀,更需要高質(zhì)、更精準(zhǔn)的數(shù)據(jù)來進(jìn)行算法訓(xùn)練。
從安全性上來看,標(biāo)注數(shù)據(jù)質(zhì)量的高低將直接影響智能駕駛的安全性。例如,人像、建筑物、植物、道路、交通標(biāo)志、車輛等數(shù)據(jù)標(biāo)注的準(zhǔn)確性直接決定智能駕駛AI對于路況的判斷,數(shù)據(jù)標(biāo)注偏差或者完成度不高會直接影響行駛安全。
2017年5月17日,美國加利福尼亞州一名車主在開啟了智能駕駛狀態(tài)下撞上前方轉(zhuǎn)彎的卡車不幸身亡。原因是智能駕駛系統(tǒng)沒有辨別出前方白色車輛和天空的區(qū)別,沒有識別出障礙物導(dǎo)致智能剎車沒有及時(shí)制動引發(fā)的事故。
從體驗(yàn)上,首先安全性的保證本身就是最佳的體驗(yàn),精準(zhǔn)的數(shù)據(jù)是確保AI智能駕駛落地的重要前提。兼?zhèn)鋽?shù)量與質(zhì)量的標(biāo)注數(shù)據(jù)可以很大程度上提升汽車智能駕駛的安全性與實(shí)用性,如何解決數(shù)據(jù)質(zhì)量問題,規(guī)避數(shù)據(jù)錯誤、保障數(shù)據(jù)質(zhì)量已經(jīng)成為智能駕駛領(lǐng)域發(fā)展的頭等大事。
“當(dāng)下,人工智能正加速往應(yīng)用人工智能方向發(fā)展,在算法、算力沒有重大突破的前提下,質(zhì)量高和安全性強(qiáng)的數(shù)據(jù)成為人工智能商業(yè)化落地的關(guān)鍵點(diǎn)?!?a href="http://ttokpm.com/tags/te/" target="_blank">Testin云測CTO陳冠誠在接受媒體采訪時(shí)表示。
從產(chǎn)業(yè)的角度來看,智能駕駛的產(chǎn)業(yè)化落地將成為高精度數(shù)據(jù)標(biāo)注行業(yè)未來發(fā)展方向的一個(gè)重要縮影,高質(zhì)量數(shù)據(jù)在促使自動駕駛產(chǎn)業(yè)化落地的同時(shí),也成為數(shù)據(jù)產(chǎn)業(yè)商業(yè)化程度不斷深入的著力點(diǎn)。
云測數(shù)據(jù)優(yōu)勢:專業(yè)定制、獨(dú)立安全,方能有的放矢
數(shù)據(jù)是整個(gè)人工智能行業(yè)的燃料,數(shù)據(jù)在智能駕駛領(lǐng)域的重要性不容置疑。絕大部分智能駕駛企業(yè)對數(shù)據(jù)也非常重視,但現(xiàn)實(shí)情況是缺乏獲得大量且高質(zhì)量數(shù)據(jù)的渠道。
據(jù)2018年智研發(fā)布的《2019-2025年中國數(shù)據(jù)標(biāo)注與審核行業(yè)市場專項(xiàng)分析研究及投資前景預(yù)測報(bào)告》顯示,近幾年,數(shù)據(jù)標(biāo)注與審核行業(yè)快速發(fā)展,2018年市場規(guī)模已達(dá)到52.55億元,阿里、騰訊、百度等多家互聯(lián)網(wǎng)巨頭都擁有海量的數(shù)據(jù)標(biāo)注需求。
實(shí)際上,數(shù)據(jù)標(biāo)注是一個(gè)簡單又困難的事情,一方面,在執(zhí)行上的難度相對算法開放要低得多,但另一方面數(shù)據(jù)標(biāo)注本質(zhì)上是要獲得更準(zhǔn)確,更精細(xì)化的數(shù)據(jù)結(jié)果,而場景數(shù)據(jù)缺失、數(shù)據(jù)質(zhì)量良莠不齊,以及隱私安全問題成為數(shù)據(jù)行業(yè)面臨的三大痛點(diǎn)。
為解決這些行業(yè)性問題,國內(nèi)AI數(shù)據(jù)服務(wù)頭部企業(yè)云測數(shù)據(jù),通過提供定制化的場景化數(shù)據(jù),來滿足業(yè)內(nèi)高標(biāo)準(zhǔn)的數(shù)據(jù)需求。
以云測數(shù)據(jù)的場景化為例,為了滿足智能駕駛領(lǐng)域不同場景的特殊需求,云測數(shù)據(jù)搭建了自己的場景實(shí)驗(yàn)室,為各種智能駕駛細(xì)分場景模擬無噪的專屬數(shù)據(jù),通過定制化數(shù)據(jù)采集直擊特定場景化下的數(shù)據(jù)缺失、質(zhì)量良莠不齊等行業(yè)問題。一方面,在場景下的定制化數(shù)據(jù)采集更加精準(zhǔn)、數(shù)據(jù)質(zhì)量更高,另一方面,定制化的數(shù)據(jù)集也與智能駕駛需求端的匹配度更高,從而最大化將數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力。
對于智能駕駛來講,無噪的專屬數(shù)據(jù)采集完成后,數(shù)據(jù)通過標(biāo)注后或者說加上標(biāo)簽才有意義,才能用于算法的學(xué)習(xí)和訓(xùn)練,最終智能駕駛的應(yīng)用落地。
當(dāng)前的自動駕駛所需數(shù)據(jù)需求,正向著多模態(tài)的方向發(fā)展。所謂多模態(tài),即是對多維時(shí)間、空間、環(huán)境數(shù)據(jù)的感知與融合。比如當(dāng)前的自動駕駛需要雷達(dá)+攝像頭才能跑的更穩(wěn),相對應(yīng)的,就需要2D/3D融合標(biāo)注工具。
在標(biāo)注工具方面,云測數(shù)據(jù)自研了一套可以支持圖片、語音、文本等多品類的標(biāo)注平臺,其中的三維標(biāo)注工具,尤其是3D點(diǎn)云的標(biāo)注工具,對雷達(dá)成像的圖像中的機(jī)動車、障礙物、行人等多目標(biāo)進(jìn)行3D標(biāo)注,并通過渲染引擎的優(yōu)化,來保證整個(gè)過程的流暢和快捷,在數(shù)據(jù)質(zhì)量的導(dǎo)向下實(shí)現(xiàn)更優(yōu)的品控和更快的數(shù)據(jù)交付,當(dāng)屬業(yè)內(nèi)領(lǐng)先。對此,數(shù)據(jù)數(shù)據(jù)總經(jīng)理賈宇航表示,“我們希望通過精準(zhǔn)高質(zhì)、獨(dú)立安全的數(shù)據(jù)幫助智能駕駛客戶快速構(gòu)建核心數(shù)據(jù)壁壘?!?/p>
值得一提的是,智能駕駛客戶在選擇數(shù)據(jù)供應(yīng)商時(shí),獨(dú)立第三方數(shù)據(jù)標(biāo)注公司更具優(yōu)勢。
某業(yè)內(nèi)人士在接受采訪時(shí)表示“考慮到大廠能也有自動駕駛的團(tuán)隊(duì)或業(yè)務(wù),難免會擔(dān)心自家數(shù)據(jù)被拿去訓(xùn)練別人的模型;再加上要價(jià)不菲,所以合作并不多。如果跟第三方數(shù)據(jù)標(biāo)注公司合作,就不用擔(dān)憂這種問題。他們要價(jià)合理,而且既不會把數(shù)據(jù)外泄,也不會自用?!?/p>
目前云測數(shù)據(jù)在華東、華北、華南設(shè)有數(shù)據(jù)標(biāo)注基地,還有幾個(gè)基地在部署中,并擁有行業(yè)內(nèi)最大規(guī)模的專業(yè)數(shù)據(jù)服務(wù)全職人員,用來構(gòu)建整體 AI 數(shù)據(jù)的生態(tài)。
尾聲:
隨著AI技術(shù)商業(yè)化的持續(xù)深入,算法、算力方興未艾之時(shí),場景化的數(shù)據(jù)成為推動AI深入長尾應(yīng)用的關(guān)鍵推動力。
作為人工智能領(lǐng)域內(nèi)最值得期待的場景,智能駕駛產(chǎn)業(yè)落地的大門已然開啟。場景化、定制化的高質(zhì)量的數(shù)據(jù)已成為智能駕駛領(lǐng)域最需要的基礎(chǔ)動力之一,而數(shù)據(jù)產(chǎn)業(yè)也將在不斷深入的產(chǎn)業(yè)落地中,為科技的進(jìn)步和發(fā)展貢獻(xiàn)著力量。
責(zé)任編輯:ct
評論
查看更多