算法、算力和數(shù)據(jù)共同構(gòu)成了AI產(chǎn)業(yè)鏈技術(shù)發(fā)展的三大核心要素。在人工智能行業(yè)發(fā)展進(jìn)程中,有監(jiān)督的深度學(xué)習(xí)算法是推動(dòng)人工智能技術(shù)取得突破性發(fā)展的關(guān)鍵技術(shù)理論,而大量訓(xùn)練數(shù)據(jù)的支撐則是有監(jiān)督的深度學(xué)習(xí)算法實(shí)現(xiàn)的基礎(chǔ)。算法模型從技術(shù)理論到應(yīng)用實(shí)踐的落地過(guò)程皆依賴于大量的訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)可以說(shuō)是人工智能技術(shù)發(fā)展和進(jìn)步的基礎(chǔ)“燃料”。標(biāo)貝科技是我國(guó)早期進(jìn)入基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的企業(yè)之一,對(duì)于未來(lái)訓(xùn)練數(shù)據(jù)發(fā)展趨勢(shì)看法如下:
AI產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)的持續(xù)性需求一直存在
基于成熟算法模型的拓展性需求和新生算法模型的前瞻性需求,AI產(chǎn)業(yè)對(duì)訓(xùn)練數(shù)據(jù)的需求將會(huì)一直存在。在成熟的拓展性需求方面,標(biāo)貝科技的研究報(bào)告表明:深度學(xué)習(xí)模型對(duì)訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量、多樣性和更新速度方面都有著較高要求,為充分發(fā)揮技術(shù)潛能,深度學(xué)習(xí)模型需要海量且涵蓋圖像、視頻及語(yǔ)音在內(nèi)等多種類型的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練。
此外,人工智能技術(shù)要求算法模型根據(jù)潛在的應(yīng)用場(chǎng)景變化而持續(xù)更新,因此,算法模型所使用的訓(xùn)練數(shù)據(jù)亦需要定期更新。具體而言,大部分算法模型的訓(xùn)練數(shù)據(jù)需要每月至少更新一次,部分算法模型的訓(xùn)練數(shù)據(jù)需要每日至少更新一次,算法模型持續(xù)更新的特點(diǎn)將進(jìn)一步拓展各領(lǐng)域AI數(shù)據(jù)服務(wù)的需求空間。
而在新生的前瞻性需求方面,隨著人工智能商業(yè)化進(jìn)程的演進(jìn),新興應(yīng)用場(chǎng)景如智聯(lián)網(wǎng)AIoT、AIPaaS、產(chǎn)業(yè)互聯(lián)網(wǎng)等將展現(xiàn)出巨大的發(fā)展?jié)摿?,并逐步促進(jìn)AI技術(shù)和算法模型的優(yōu)化和創(chuàng)新。因此,在創(chuàng)新應(yīng)用場(chǎng)景和新型算法的帶動(dòng)下,具有前瞻性的訓(xùn)練數(shù)據(jù)產(chǎn)品和高定制化的AI數(shù)據(jù)服務(wù)需求也成為需求方越來(lái)越重視的數(shù)據(jù)要求之一。
定制化、精細(xì)化、場(chǎng)景化AI訓(xùn)練數(shù)據(jù)將將成為基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)主流
在行業(yè)發(fā)展前期,基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的門檻較低,行業(yè)標(biāo)準(zhǔn)模糊,服務(wù)質(zhì)量也參差不齊。隨著AI產(chǎn)業(yè)落地成為主流,基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)整體競(jìng)爭(zhēng)也愈發(fā)激烈,需求方對(duì)訓(xùn)練數(shù)據(jù)質(zhì)量的要求不斷提高,垂直場(chǎng)景的定制化訓(xùn)練數(shù)據(jù)需求成為主流,需求方市場(chǎng)對(duì)訓(xùn)練數(shù)據(jù)的要求逐漸向精細(xì)化轉(zhuǎn)型。需求方對(duì)訓(xùn)練數(shù)據(jù)的精細(xì)化需求主要體現(xiàn)在兩方面:
一方面,人工智能算法應(yīng)用要經(jīng)歷研發(fā)、訓(xùn)練和落地三個(gè)階段,需求方根據(jù)算法應(yīng)用的不同階段對(duì)訓(xùn)練數(shù)據(jù)提出差異化需求:
研發(fā)階段:需求方的數(shù)據(jù)需求是對(duì)新拓展領(lǐng)域或新建算法的訓(xùn)練,對(duì)訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量要求較高,但數(shù)據(jù)標(biāo)注內(nèi)容傾向于標(biāo)準(zhǔn)化標(biāo)注;
訓(xùn)練階段:需求方的數(shù)據(jù)需求一般是對(duì)算法的準(zhǔn)確性和健壯性進(jìn)行優(yōu)化,對(duì)數(shù)據(jù)標(biāo)注的內(nèi)容需求較為豐富,對(duì)數(shù)據(jù)準(zhǔn)確性要求較高;
落地階段:需求方的數(shù)據(jù)需求一般為算法較成熟的核心場(chǎng)景,對(duì)訓(xùn)練數(shù)據(jù)的內(nèi)容有特定指向,采標(biāo)難度較大。
同時(shí),數(shù)據(jù)需求方對(duì)基礎(chǔ)數(shù)據(jù)服務(wù)商的技術(shù)能力、服務(wù)意識(shí)、穩(wěn)定性和效率有較高要求。隨著人工智能技術(shù)的發(fā)展及與應(yīng)用場(chǎng)景的深入結(jié)合,訓(xùn)練需求和落地需求逐漸成為主流。
另一方面,需求方對(duì)基礎(chǔ)數(shù)據(jù)服務(wù)商的數(shù)據(jù)安全、采標(biāo)能力、數(shù)據(jù)質(zhì)量、管理能力、服務(wù)能力等核心能力提出了更高的要求。標(biāo)貝科技是較早進(jìn)行進(jìn)入基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)的企業(yè)之一,積極鉆研數(shù)據(jù)訓(xùn)練核心技術(shù),在基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)積累了大量的落地實(shí)施案例,擁有自研數(shù)據(jù)采集以及數(shù)據(jù)標(biāo)注平臺(tái)。
在數(shù)據(jù)安全方面,標(biāo)貝可滿足需求方對(duì)數(shù)據(jù)授權(quán)、數(shù)據(jù)傳輸、存儲(chǔ)及結(jié)項(xiàng)后的數(shù)據(jù)銷毀數(shù)據(jù)安全技術(shù);在采標(biāo)能力方面,標(biāo)貝可滿足需求方在某些特定領(lǐng)域或垂直場(chǎng)景的采集能力、定制研發(fā)標(biāo)注工具的能力;在數(shù)據(jù)質(zhì)量方面,標(biāo)貝科技可做到100%的數(shù)據(jù)準(zhǔn)確率的交付;此外,標(biāo)貝以出色的項(xiàng)目管理能力、服務(wù)效率以及執(zhí)行團(tuán)隊(duì)的素養(yǎng)與信譽(yù)在基礎(chǔ)數(shù)據(jù)行業(yè)具有較大的競(jìng)爭(zhēng)優(yōu)勢(shì);標(biāo)貝科技可快速響應(yīng)客戶需求,積極主動(dòng)為客戶提供多種樣式的基礎(chǔ)數(shù)據(jù)服務(wù)解決方案,滿足用戶定制化、精細(xì)化、場(chǎng)景化數(shù)據(jù)需求。
-
數(shù)據(jù)采集
+關(guān)注
關(guān)注
38文章
5818瀏覽量
113430 -
AI
+關(guān)注
關(guān)注
87文章
29824瀏覽量
268112 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1200瀏覽量
24621
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論