作為數(shù)據(jù)挖掘研究領(lǐng)域最具影響力的國(guó)際頂級(jí)賽事,素有“數(shù)據(jù)世界杯“之譽(yù)的KDD Cup日前正式公布了KDD Cup 2019三項(xiàng)重大賽事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三場(chǎng)比賽,其中開(kāi)賽22年以來(lái)首次引入的AutoML Competition挑戰(zhàn)賽受到不少學(xué)術(shù)及工業(yè)界專業(yè)人士的關(guān)注。
AutoML(Automated/Automatic Machine Learning,自動(dòng)機(jī)器學(xué)習(xí))旨在研究在沒(méi)有專業(yè)知識(shí)的情況下、使用的低門檻甚至零門檻的機(jī)器學(xué)習(xí)算法,在AI人才緊缺的情況下,AutoML可以降低AI落地過(guò)程中對(duì)科學(xué)家的依賴,是2014年以來(lái)機(jī)器學(xué)習(xí)領(lǐng)域最炙手可熱的研究對(duì)象之一。2018年1月,谷歌高調(diào)推出自動(dòng)機(jī)器學(xué)習(xí)產(chǎn)品Cloud AutoML,再次將這項(xiàng)技術(shù)推向更多人的視野中,目前AutoML已成為國(guó)內(nèi)外科技巨頭關(guān)注的焦點(diǎn)。
由于日益受到學(xué)術(shù)界、工業(yè)界的廣泛關(guān)注,NeurIPS、IJCAI等學(xué)術(shù)頂會(huì)從去年開(kāi)始將AutoML視為重點(diǎn)。
本次KDD Cup選擇將其納入比賽內(nèi)容,并為此打破歷來(lái)數(shù)據(jù)挖掘方向賽事的傳統(tǒng),也是基于對(duì)AutoML技術(shù)發(fā)展趨勢(shì)和落地價(jià)值的認(rèn)可。對(duì)此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD關(guān)注的重點(diǎn),也是一項(xiàng)AI落地的關(guān)鍵技術(shù)。
據(jù)了解,本次KDD Cup AutoML挑戰(zhàn)賽由第四范式主辦,微軟、AutoML領(lǐng)域最權(quán)威的學(xué)術(shù)組織ChaLearn協(xié)辦,并為此次比賽設(shè)置了“史上”難度最高的比賽項(xiàng)目——基于時(shí)序關(guān)系型數(shù)據(jù)的AutoML。
時(shí)序關(guān)系型數(shù)據(jù)在在線廣告、推薦系統(tǒng)、金融市場(chǎng)分析、醫(yī)療等應(yīng)用場(chǎng)景中非常常見(jiàn),人們往往需要利用這樣的數(shù)據(jù)去構(gòu)建機(jī)器學(xué)習(xí)模型,并應(yīng)用機(jī)器學(xué)習(xí)模型提升對(duì)應(yīng)業(yè)務(wù)的效果。
賽事主要負(fù)責(zé)人、第四范式資深算法科學(xué)家涂威威表示這是AutoML比賽歷史上首次考慮時(shí)序關(guān)系型多表數(shù)據(jù),會(huì)重點(diǎn)考察AutoML在實(shí)際應(yīng)用場(chǎng)景中的能力,應(yīng)對(duì)關(guān)系型、時(shí)序等多表類型數(shù)據(jù)的挑戰(zhàn),探索AutoML解決實(shí)際問(wèn)題的價(jià)值。競(jìng)賽已于4月1日正式拉開(kāi)帷幕,挑戰(zhàn)賽分Feedback(反饋)、Check(校驗(yàn))、AutoML(盲測(cè))3個(gè)階段,最終根據(jù)AUC排名選出冠軍團(tuán)隊(duì),并在7月20日公布比賽結(jié)果。
值得一提的是,KDD Cup比賽向來(lái)由具備深厚學(xué)術(shù)積累和行業(yè)實(shí)踐的頂級(jí)企業(yè)或高校承辦,競(jìng)爭(zhēng)極為激烈,歷屆承辦方包括微軟、阿里等巨頭公司和卡耐基·梅隆大學(xué)等知名高校。
大數(shù)據(jù)文摘據(jù)大賽的主辦資質(zhì)等問(wèn)題采訪了本次的主辦方之一——第四范式資深算法科學(xué)家、也是本次AutoML主委會(huì)成員涂威威,他表示KDD Cup每年賽事需要大家提案,組委會(huì)會(huì)根據(jù)賽事挑戰(zhàn)性、實(shí)際應(yīng)用性、賽程規(guī)劃等多維度標(biāo)準(zhǔn)來(lái)篩選賽事方案。
第四范式作為首屆KDD CUP AutoML大賽的主辦方,將會(huì)肩負(fù)起賽事提案、數(shù)據(jù)提供、平臺(tái)搭建、賽事報(bào)名招募、競(jìng)賽以及評(píng)選等全部流程重任。
“具體審核流程并不清楚,我們?cè)贙DD Cup賽事提案獲得了組委會(huì)及主席的認(rèn)可和信任,KDD Cup的Chair也充分表明了對(duì)AutoML應(yīng)用價(jià)值的肯定。”
AI技術(shù)的發(fā)展,興起于比賽,成功于行業(yè),此前ImageNet賽事推動(dòng)了一大批CV公司的成長(zhǎng),并且極大地促進(jìn)了行業(yè)爆發(fā)。AutoML的產(chǎn)業(yè)發(fā)展延續(xù)了這個(gè)路徑,此次首登“數(shù)據(jù)世界杯”的比賽舞臺(tái),KDD平臺(tái)將有望吸引更多“全球最聰明的大腦”參與到AutoML進(jìn)程中,AutoML或?qū)⒙涞赜诟鼜V泛的行業(yè)和場(chǎng)景,迎來(lái)新的發(fā)展高峰。
對(duì)于這次新增賽題AutoML,涂威威也表示,反映了整個(gè)大行業(yè)的AI自動(dòng)化趨勢(shì)。因?yàn)锳I人才緊缺始終是AI落地的核心痛點(diǎn),自動(dòng)化工具就是試圖解決這樣的痛點(diǎn),正在成為改變目前AI科學(xué)家瓶頸以及行業(yè)應(yīng)用門檻的關(guān)鍵技術(shù),近年來(lái)AutoML已成為國(guó)內(nèi)外科技巨頭關(guān)注的焦點(diǎn)。
“AutoML是機(jī)器學(xué)習(xí)國(guó)際研究的前沿,需要更多的研究者參與到基礎(chǔ)算法研究和實(shí)際落地中來(lái),我們深知需要整個(gè)學(xué)術(shù)界和工業(yè)界一起來(lái)推動(dòng)技術(shù)的進(jìn)步,因此我們做了很多實(shí)際的推動(dòng),KDD Cup最終選擇重點(diǎn)關(guān)注AutoML比賽,并引用我們的比賽作為AutoML大賽的示例與首秀,也從側(cè)面證明了我們這幾年推動(dòng)的正向效果?!?/p>
最后,對(duì)于本次“史上最難比賽項(xiàng)目”,第四范式也為參賽者提供了一些小tip:
首先,歡迎更多對(duì)AutoML關(guān)注和有興趣的同學(xué)參加比賽,甚至加入我們一起推動(dòng)AutoML的發(fā)展,共同探索AutoML無(wú)限可能。
需要提醒參賽者提交AutoML方案是需要注意的幾個(gè)關(guān)鍵點(diǎn):
如何自動(dòng)生成有效的時(shí)序信息?
如何將多個(gè)相關(guān)表信息有效整合?
如何解決數(shù)據(jù)分布隨時(shí)序緩慢變化的問(wèn)題?
如何自動(dòng)捕獲有意義的表間聯(lián)系?
如何自動(dòng)高效地選擇合適的機(jī)器學(xué)習(xí)模型和超參數(shù)?
如何讓方案更通用,即如何使其適用于未知的任務(wù)?
如何保持計(jì)算和內(nèi)存成本可接受?
希望所有參賽者能在本次挑戰(zhàn)賽中,充分展示自己的能力和風(fēng)采,取得更好的成績(jī)。當(dāng)然,AutoML技術(shù)的發(fā)展還有很多更具挑戰(zhàn)性的難題在前面等著我們,在今后比賽中我們會(huì)繼續(xù)與大家一起挑戰(zhàn)更高難度的問(wèn)題,讓AutoML真正大幅降低了機(jī)器學(xué)習(xí)的應(yīng)用門檻,賦能非機(jī)器學(xué)習(xí)背景的人可以輕松使用。
目前,KDD2019官網(wǎng)已經(jīng)放出了大賽的三個(gè)賽題,其中,AutoML比賽詳情頁(yè)面已經(jīng)發(fā)布。SIGKDD-2019將于2019年8月4日至8日在美國(guó)阿拉斯加州安克雷奇舉行。比賽預(yù)計(jì)將持續(xù)2-4個(gè)月,獲勝者將在2019年7月中旬被通知,并在KDD會(huì)議開(kāi)幕式上接受頒獎(jiǎng),最終在會(huì)議期間在KDD杯研討會(huì)上展示他們的解決方案。
-
數(shù)據(jù)挖掘
+關(guān)注
關(guān)注
1文章
406瀏覽量
24150 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8306瀏覽量
131867 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1243瀏覽量
24007
原文標(biāo)題:“數(shù)據(jù)世界杯”KDD Cup 2019賽題正式公布,首次挑戰(zhàn)AutoML產(chǎn)業(yè)落地最大難題
文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論