正確的設(shè)計(jì)可以使更多的數(shù)據(jù)科學(xué)見(jiàn)解(甚至是不完美的,概率性的見(jiàn)解)。
我們生活在機(jī)器學(xué)習(xí)時(shí)代。 這意味著我們所制造的產(chǎn)品越來(lái)越少地以事實(shí)為依據(jù)進(jìn)行交易:相反,它們?cè)絹?lái)越依賴(lài)于推理,預(yù)測(cè)和推薦等概率性事物。 根據(jù)定義,這些事情具有不確定性。 不可避免地,它們將是錯(cuò)誤的。
但這并不意味著它們沒(méi)有產(chǎn)品價(jià)值。 畢竟,您可能寧愿知道下雨的幾率是50%,而根本沒(méi)有天氣預(yù)報(bào)。 我們?nèi)绾尾拍軓腻e(cuò)誤的算法中釋放用戶(hù)價(jià)值? 我們可以做預(yù)測(cè)所要做的事情:設(shè)計(jì)產(chǎn)品時(shí)要先于不確定性。
在機(jī)器學(xué)習(xí)時(shí)代,設(shè)計(jì)能夠傳達(dá)確定性的產(chǎn)品可能會(huì)帶來(lái)巨大的競(jìng)爭(zhēng)優(yōu)勢(shì):
· 它可以解鎖新的價(jià)值。 通過(guò)授權(quán)用戶(hù)就如何使用它們做出自己的判斷,而不是決定并什么都不做,我們可以產(chǎn)生并發(fā)送更多的數(shù)據(jù)科學(xué)見(jiàn)解-甚至是不完美的,概率性的見(jiàn)解。
· 它可以減少風(fēng)險(xiǎn)。 傳達(dá)不確定性是免責(zé)聲明:用戶(hù)可以權(quán)衡證據(jù)并得出結(jié)論的風(fēng)險(xiǎn)由自己承擔(dān),而不必以產(chǎn)品的面值提出索賠,并使產(chǎn)品對(duì)不透明,錯(cuò)誤的結(jié)論負(fù)責(zé)。
· 它可以提高可用性。 好的設(shè)計(jì)可以使用戶(hù)看到產(chǎn)品在做什么:系統(tǒng)狀態(tài)的可見(jiàn)性是Nielsen Norman進(jìn)行用戶(hù)界面設(shè)計(jì)的第一種啟發(fā)式方法。 不確定性的可見(jiàn)性為用戶(hù)節(jié)省了自己弄清楚某事物的可靠性的痛苦。
這一切有問(wèn)題嗎? 不確定性很難設(shè)計(jì)。 機(jī)器學(xué)習(xí)表示概率的不確定性,但是概率不是產(chǎn)品:普通人不想鉆研p值和置信區(qū)間,設(shè)計(jì)人員也不想創(chuàng)建充滿(mǎn)星號(hào)和技術(shù)知識(shí)的復(fù)雜怪獸。 此外,非專(zhuān)家不太擅長(zhǎng)解釋原始概率,有時(shí)會(huì)將其轉(zhuǎn)變?yōu)榭膳碌膽?zhàn)略決策。
我們應(yīng)該傳達(dá)產(chǎn)品中的不確定性,但是我們需要有效的,以用戶(hù)為中心的設(shè)計(jì)解決方案來(lái)做到這一點(diǎn)。 在本文中,我將介紹三種效果很好的設(shè)計(jì)模式:
· 展示你的作品
· 顯示單個(gè)數(shù)據(jù)點(diǎn)
· 讓用戶(hù)完成難題
為了具體起見(jiàn),我主要從Context(我們的法律數(shù)據(jù)分析產(chǎn)品)中提取示例,該產(chǎn)品從數(shù)百萬(wàn)司法意見(jiàn)的語(yǔ)言中提取有用的見(jiàn)解。 這是將機(jī)器學(xué)習(xí)產(chǎn)品化的絕佳平臺(tái),因?yàn)槲覀兊穆蓭熡脩?hù)群可以高度懷疑概率,完全不容忍錯(cuò)誤。 我們?cè)谠O(shè)計(jì)適用于他們的產(chǎn)品方面學(xué)到了很多東西!
設(shè)計(jì)模式1:展示您的作品
這里的公式很簡(jiǎn)單:提供您的概率見(jiàn)解(現(xiàn)在機(jī)場(chǎng)有點(diǎn)繁忙...),并讓用戶(hù)知道您的算法是如何到達(dá)的(...基于對(duì)這個(gè)地方的訪(fǎng)問(wèn))。 Google Maps這樣做:
這可以使您的見(jiàn)解更具辯護(hù)性和實(shí)用性:用戶(hù)可以根據(jù)他們?cè)诜椒ㄕ撝锌吹降娜魏翁囟ㄆ?jiàn)或限制進(jìn)行調(diào)整,并自己決定結(jié)論的信心。
在上下文中,我們的見(jiàn)解基于司法文件的書(shū)面語(yǔ)言。 下面,我們的語(yǔ)言算法發(fā)現(xiàn)了一位專(zhuān)業(yè)證人Giles博士和一家律師事務(wù)所Thompson&Knight有一個(gè)先前的聯(lián)系:他們過(guò)去似乎互相反對(duì)(在決定是否要 聘請(qǐng)Giles博士)。 我們的設(shè)計(jì)顯示了導(dǎo)致算法得出該結(jié)論的確切語(yǔ)言。 這可以幫助用戶(hù)驗(yàn)證結(jié)論,并且可以進(jìn)一步深入了解該專(zhuān)家和律師事務(wù)所如何相互了解:
在推薦引擎的世界中展示您的工作也很方便。 下面的設(shè)計(jì)以完整句子的形式進(jìn)行:
這種設(shè)計(jì)從字面上告訴用戶(hù)該算法的工作原理:從本質(zhì)上講,該算法只是吸引過(guò)去的客戶(hù)作為推薦者,這是一種稱(chēng)為協(xié)作過(guò)濾的聰明技術(shù)。 通過(guò)完全透明,設(shè)計(jì)消除了滿(mǎn)足不確定的潛在期望的算法,例如推薦相似,相關(guān)或誘人的產(chǎn)品。
最后,有時(shí)展示您的作品可能會(huì)成為主要的吸引力。 在拉威爾法(Ravel Law),我們建立了一個(gè)實(shí)驗(yàn)性動(dòng)議結(jié)果預(yù)測(cè)器,該預(yù)測(cè)器可計(jì)算出法院將批準(zhǔn)某項(xiàng)動(dòng)議的機(jī)會(huì)百分比,并顯示出不同的因素(如主張的辯護(hù)類(lèi)型)如何憑經(jīng)驗(yàn)或多或少地獲得授權(quán)。 我們通過(guò)簡(jiǎn)單的可視化展示了因子權(quán)重:
我們向預(yù)報(bào)員展示的律師比對(duì)結(jié)果的精確預(yù)測(cè)要更感興趣的是了解這些單獨(dú)因素的作用-他們?cè)谄鸩葑h案時(shí)可以控制的可操作性。 預(yù)測(cè)是困難且不確定的,但是顯示我們(模型)的工作為我們的律師提供了有用的參考。
設(shè)計(jì)模式2:顯示單個(gè)數(shù)據(jù)點(diǎn)
如今,單個(gè)數(shù)據(jù)點(diǎn)很少,這似乎是遺物,許多設(shè)計(jì)重點(diǎn)在于如何以數(shù)據(jù)儀表板的形式將大量數(shù)據(jù)集抽象為人類(lèi)可理解的概括。 但是泛化會(huì)給我們帶來(lái)麻煩,尤其是在數(shù)據(jù)稀疏的情況下。 矛盾的是,大數(shù)據(jù)意味著我們現(xiàn)在比以往擁有更多的小型數(shù)據(jù)集,將大數(shù)據(jù)切片和切塊的結(jié)果縮小到我們感興趣的范圍。我們應(yīng)該針對(duì)小數(shù)據(jù)固有的不確定性進(jìn)行設(shè)計(jì)。
此外,在大小數(shù)據(jù)集中,當(dāng)數(shù)據(jù)實(shí)際上遵循與我們假設(shè)不同的分布時(shí),匆忙下結(jié)論可能會(huì)帶來(lái)麻煩。 潛在的分布可能是偏斜的,雙峰的,甚至是相反的,如本例中的辛普森悖論所示:
對(duì)于產(chǎn)品而言,揭示單個(gè)原始數(shù)據(jù)點(diǎn)可能更安全(通常更有用),從而傳達(dá)其結(jié)論是否可靠的不確定性。 考慮一下我們的Context設(shè)計(jì)之一,它顯示了專(zhuān)家證人在法庭上成功取證的成功記錄:
最初的設(shè)計(jì)需要大量的"匯總統(tǒng)計(jì)數(shù)據(jù)",正如我們所說(shuō)的那樣-多個(gè)條形圖斷定了專(zhuān)家在各種情況下的證詞接納率。 問(wèn)題在于,許多專(zhuān)家只有一個(gè)或兩個(gè)結(jié)果,這不足以使這些圖表可靠地發(fā)揮作用。 我們本來(lái)會(huì)很笨拙地宣布,每個(gè)數(shù)據(jù)點(diǎn)都支持0%和100%的導(dǎo)納率,這在技術(shù)上不是錯(cuò)誤的,但暗示著專(zhuān)家作證的方式過(guò)于確定。 取而代之的是,我們的最終設(shè)計(jì)將專(zhuān)家證言的每一個(gè)挑戰(zhàn)形象化,讓用戶(hù)發(fā)現(xiàn)模式并自行判斷他們應(yīng)該如何對(duì)待它們。
設(shè)計(jì)模式3:讓用戶(hù)解決難題
機(jī)器學(xué)習(xí)可以做令人驚奇的事情-但它仍然不能解決所有問(wèn)題,難題的某些部分最好交給人類(lèi)。 一種算法可能擅長(zhǎng)查找片段,但不確定整體解決方案。 我們的設(shè)計(jì)應(yīng)為用戶(hù)安排這些作品,并自行設(shè)置完成拼圖。
當(dāng)涉及人工智能尚未真正解決的高階問(wèn)題(例如解釋因果關(guān)系)時(shí),這種想法最為有趣。 我們的上下文用戶(hù)看到隨著時(shí)間的流逝,影響特定公司的訴訟數(shù)量激增,并想知道是什么導(dǎo)致了這些激增。 我們的設(shè)計(jì)在平行的時(shí)間軸上安排了法律案件和新聞報(bào)道群,邀請(qǐng)用戶(hù)自己推斷因果關(guān)系。 在這里,用戶(hù)可能會(huì)假設(shè)涉及Chipotle的法律案件激增可以由稍早一些有關(guān)Chipotle和E. coli的新聞?lì)^條解釋?zhuān)?/p>
這樣的問(wèn)題-為什么會(huì)發(fā)生什么,接下來(lái)會(huì)發(fā)生什么,您應(yīng)該怎么做-很難解決并且冒險(xiǎn)做出明確的回答。 但是我們不必做任何事情,至少不是完全沒(méi)有做。 通過(guò)暗示性地排列算法確實(shí)找到的難題部分,產(chǎn)品設(shè)計(jì)可以激發(fā)用戶(hù)進(jìn)行思考,充實(shí)和評(píng)估的想法,從而使人類(lèi)處于循環(huán)中,以從不完善的機(jī)器學(xué)習(xí)中提取價(jià)值。
最后的想法
通過(guò)設(shè)計(jì)不確定性,我們可以解鎖全新的產(chǎn)品,在這些產(chǎn)品中,機(jī)器學(xué)習(xí)對(duì)于傳統(tǒng)設(shè)計(jì)可能不夠精確。 我提供了產(chǎn)品設(shè)計(jì)可以傳達(dá)不確定性的三種方式:展示他們的工作,揭示單個(gè)數(shù)據(jù)點(diǎn)以及讓用戶(hù)完成難題。 但是,隨著機(jī)器學(xué)習(xí)的發(fā)展,以及用戶(hù)對(duì)不確定性的更深入思考以及道德和法規(guī)要求透明性,我們揭示不確定性的設(shè)計(jì)解決方案范圍肯定會(huì)增加。 我期待看到我們的想法。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8356瀏覽量
132324
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論