一、合成數(shù)據(jù),保護(hù)隱私
目前,由于 AI 技術(shù)呈指數(shù)級(jí)發(fā)展,變得更加先進(jìn),但其局限性仍然存在。例如,某些行業(yè)缺乏足夠的真實(shí)數(shù)據(jù)來(lái)訓(xùn)練 AI 模型,又或者合規(guī)隱私成為一些行業(yè)技術(shù)發(fā)展的痛點(diǎn)。企業(yè)紛紛開(kāi)始部署 Synthetic data (合成數(shù)據(jù)),即由計(jì)算機(jī)人工生成的數(shù)據(jù),可用于替代自現(xiàn)實(shí)世界中采集的真實(shí)數(shù)據(jù)集。
現(xiàn)階段,基于 GANs 的圖像合成技術(shù)和視頻合成技術(shù)發(fā)展迅猛,但高效且可行的表格數(shù)據(jù)合成技術(shù)仍處于初級(jí)階段。整體來(lái)看,數(shù)據(jù)匿名化、隱私合規(guī)和糾正算法偏見(jiàn)等優(yōu)勢(shì)使得合成數(shù)據(jù)技術(shù)成為吸引各行業(yè)公司的關(guān)鍵要素。
二、芯片追逐戰(zhàn)
隨著 AI 技術(shù)不斷進(jìn)步,加速在各行業(yè)落地應(yīng)用。無(wú)論是云數(shù)據(jù)中心還是像照相機(jī)這樣的智能邊緣設(shè)備,適用于計(jì)算密集型的專(zhuān)業(yè)硬件需求激增。
由于空間和能源的限制,大型芯片并不適用于許多日常的 AI 應(yīng)用場(chǎng)景??紤]到這一點(diǎn),越來(lái)越多的公司開(kāi)始研發(fā)可以用于汽車(chē)傳感器、照相機(jī)、自動(dòng)化工廠機(jī)器人等低功耗設(shè)備的 AI 芯片。
三、AI 賦能內(nèi)容審核
在美國(guó),玩電子游戲的人數(shù)達(dá)到了史上前所未有的最高水平。76% 的 18 歲以下的青少年沉迷于電子游戲,這讓家長(zhǎng)們擔(dān)心孩子們極有可能接觸到不合時(shí)宜或者充滿(mǎn)仇恨的信息。
隨著元宇宙的火熱以及網(wǎng)絡(luò)游戲生態(tài)系統(tǒng)的迅速發(fā)展,有害信息已經(jīng)從社交媒體蔓延到新的陣地,即網(wǎng)絡(luò)游戲和虛擬世界。
網(wǎng)絡(luò)游戲環(huán)境惡劣,充斥著各種仇恨言論、網(wǎng)絡(luò)霸凌以及故意退出。反誹謗聯(lián)盟的一項(xiàng)研究發(fā)現(xiàn),在比較受歡迎的多人游戲中,高達(dá) 80% 的玩家都曾受到騷擾。
一些初創(chuàng)公司正著眼于利用 AI 技術(shù)進(jìn)行內(nèi)容審核。Spectrum Labs 稱(chēng),其 NLP 平臺(tái)可以將音頻和文本的內(nèi)容審核工作減少 50% ,有害信息檢測(cè)能力提高 10 倍。
利用 AI 技術(shù)實(shí)現(xiàn)完美的內(nèi)容審核是不可能的。在線(xiàn)用戶(hù)能夠不斷適應(yīng)審查規(guī)則,逃避平臺(tái)的審查。但是,在 NLP 和基于深度學(xué)習(xí)的圖像分類(lèi)等關(guān)鍵領(lǐng)域取得的突破,以及以?xún)?nèi)容審查為業(yè)務(wù)方向的 AI 初創(chuàng)企業(yè)獲得多輪融資,在一定程度上表明了 AI 審核將成為未來(lái)的方向之一。
四、Deepfakes 檢測(cè)
Deepfakes(深度偽造)不僅能創(chuàng)造出極其逼真的圖像,還能生成“假”聲音和視頻。
利用 AI 學(xué)習(xí)算法,Deepfakes 的技術(shù)愈發(fā)精進(jìn),效果十分逼真。網(wǎng)絡(luò)上公開(kāi)發(fā)布的視頻和錄音數(shù)量之多,容易獲取,這使得訓(xùn)練 AI 算法和 Deepfakes 容易許多。研究人員表示,對(duì)于人們來(lái)說(shuō),區(qū)分 AI 偽造的人像、物體和視頻與真實(shí)情況十分困難。
Deepfakes 衍生出的假新聞和假消息是一個(gè)大問(wèn)題。對(duì)于消費(fèi)者來(lái)說(shuō)。Deepfakes 還有可能成為網(wǎng)絡(luò)釣魚(yú)和勒索詐騙的工具。
為了應(yīng)對(duì)日益增長(zhǎng)的網(wǎng)絡(luò)安全威脅,一些科技公司開(kāi)始嘗試各種解決方案,包括設(shè)備端認(rèn)證軟件和 API、區(qū)塊鏈等。去年,Meta 的研究人員聲稱(chēng)他們不僅可以確定圖像是否是偽造的,還可以剖析用于深度偽造的 AI 模型。但是 Deepfakes 技術(shù)還將持續(xù)演進(jìn)、無(wú)處不在,人們需要尋找新的方法將其摧毀。
五、低代碼/零代碼開(kāi)發(fā)
算法能將自然語(yǔ)言命令翻譯成計(jì)算機(jī)代碼,特別是對(duì)公民開(kāi)發(fā)者來(lái)說(shuō),這意味著軟件開(kāi)發(fā)新一股的浪潮。
目前自動(dòng)編程仍處于初級(jí)階段。但該領(lǐng)域技術(shù)進(jìn)步促使一些初創(chuàng)公司不斷拓展零代碼/低代碼解決方案,讓非技術(shù)用戶(hù)能夠參與數(shù)據(jù)科學(xué)項(xiàng)目,縮小技能差距,并加快生產(chǎn)周期。
六、多模態(tài) AI 崛起
多模態(tài) AI 正在打破單一感官的藩籬,使用一個(gè)通用 AI 模型科技將多種類(lèi)型的數(shù)據(jù)所蘊(yùn)含的語(yǔ)義信息概念化并作出預(yù)測(cè)。
多模態(tài) AI 正在從實(shí)驗(yàn)室走到實(shí)際應(yīng)用。例如,谷歌正在使用多模態(tài) AI 來(lái)改進(jìn)搜索體驗(yàn)。未來(lái),如果用戶(hù)上傳了一張登山靴的照片,并附上“我能穿著這雙靴子去富士山徒步旅行嗎?”的文字,搜索引擎將識(shí)別上傳的圖像,從文本、圖像和視頻數(shù)據(jù)中挖掘網(wǎng)絡(luò)上關(guān)于富士山的信息,并將這些瑣碎的信息連接起來(lái),提供一個(gè)貼切的答案。
七、AI for AI
隨著 AI 技術(shù)應(yīng)用延展,企業(yè)正在尋求徹底改變現(xiàn)有的數(shù)據(jù)管理模式的解決方案,轉(zhuǎn)向“AI 優(yōu)先”策略。說(shuō)起來(lái)容易做起來(lái)難。從采集數(shù)據(jù)、運(yùn)行數(shù)據(jù)質(zhì)量檢查到開(kāi)發(fā)模型和監(jiān)測(cè)后期生產(chǎn)表現(xiàn),一個(gè)項(xiàng)目從原始數(shù)據(jù)轉(zhuǎn)變?yōu)樯a(chǎn)準(zhǔn)備是一個(gè)多步驟的過(guò)程。
端到端的機(jī)器學(xué)習(xí)公司將 AI 生命周期管理過(guò)程中的多步驟融合成一個(gè) SaaS 產(chǎn)品,這將為那些希望快速高效構(gòu)建 AI 系統(tǒng)的企業(yè)提供絕佳選擇。
無(wú)代碼和低代碼趨勢(shì)也擴(kuò)展至機(jī)器學(xué)習(xí)平臺(tái),以彌合 AI 技能差距,plug-and-play(即插即用)的功能激勵(lì)非專(zhuān)家人員參與到 AI 項(xiàng)目中。為此,2021 年,全球第二高估值 AI 獨(dú)角獸公司 Databricks 收購(gòu)了低程序代碼工具供應(yīng)商 8080 Labs。
隨著大多數(shù)老牌廠商開(kāi)始布局 Auto ML(自動(dòng)機(jī)器學(xué)習(xí))功能,“AI for AI”也成為增長(zhǎng)的領(lǐng)域。企業(yè)開(kāi)始使用 AI 技術(shù)將 AI 開(kāi)發(fā)過(guò)程的各環(huán)節(jié)自動(dòng)化,如數(shù)據(jù)質(zhì)量檢查或部分模型開(kāi)發(fā)環(huán)節(jié)。
持續(xù)分化,未來(lái)已來(lái),“AI for AI”將迎來(lái)更廣闊的發(fā)展空間?! ?/p>
評(píng)論
查看更多