0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

具有RAPIDS cuML的GPU加速分層DBSCAN

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-18 16:15 ? 次閱讀

不同領(lǐng)域的數(shù)據(jù)科學(xué)家使用聚類方法在他們的數(shù)據(jù)集中找到自然的“相似”觀察組。流行的聚類方法可以是:

基于質(zhì)心的:根據(jù)與某個(gè)質(zhì)心的接近程度將點(diǎn)分組為 k 組。

基于圖形的:根據(jù)圖中頂點(diǎn)的連接對(duì)其進(jìn)行分組。

Density-based:根據(jù)附近區(qū)域數(shù)據(jù)的密度或稀疏性更靈活地分組。

基于層次密度的應(yīng)用程序空間聚類 w / Noise (HDBSCAN算法是一種density-based聚類方法,對(duì)噪聲具有魯棒性(將稀疏區(qū)域中的點(diǎn)作為簇邊界,并將其中一些點(diǎn)直接標(biāo)記為噪聲)?;诿芏鹊木垲惙椒ǎ?HDBSCAN ,能夠發(fā)現(xiàn)形狀奇特、大小各異的聚類 — 與k-means、k-medioids或高斯混合模型等基于質(zhì)心的聚類方法截然不同,這些方法找到一組 k 個(gè)質(zhì)心,將簇建模為固定形狀和大小的球。除了必須預(yù)先指定 k 之外,基于質(zhì)心的算法的性能和簡(jiǎn)單性幫助它們?nèi)匀皇歉呔S聚類點(diǎn)的最流行方法之一;即使在不修改輸入數(shù)據(jù)點(diǎn)的情況下,它們也無(wú)法對(duì)不同大小、形狀或密度的簇進(jìn)行建模。

pYYBAGJdHjmAD4kbAAEFTjTlJ4c123.png

圖 1 : K-means 假設(shè)數(shù)據(jù)可以用固定大小的高斯球建模,并切割衛(wèi)星,而不是單獨(dú)聚類。 K-means 將每個(gè)點(diǎn)指定給一個(gè)簇,即使存在噪聲和異常值也會(huì)影響結(jié)果的質(zhì)心s.

pYYBAGJdHjqAIOvrAADy3drSfJI146.png

圖 2 :基于密度的算法通過(guò)從密集區(qū)域的突出鄰域擴(kuò)展簇來(lái)解決此問(wèn)題。 DBSCAN 和 HDBSCAN 可以將這些點(diǎn)解釋為噪聲,并將其標(biāo)記為噪聲,如圖中的紫色點(diǎn)。

HDBSCAN 建立在一種眾所周知的基于密度的聚類算法 DBSCAN 的基礎(chǔ)上,該算法不要求提前知道簇的數(shù)量,但仍然存在一個(gè)不幸的缺點(diǎn),即假設(shè)簇可以用一個(gè)全局密度閾值建模。這使得對(duì)具有不同密度的簇進(jìn)行建模變得困難。 HDBSCAN 改進(jìn)了這一缺點(diǎn),通過(guò)使用單鏈聚簇來(lái)構(gòu)建樹(shù)狀圖,從而可以找到不同密度的簇。另一種著名的基于密度的聚類方法稱為光學(xué)算法,它改進(jìn)了 DBSCAN ,并使用分層聚類來(lái)發(fā)現(xiàn)密度不同的聚類。光學(xué)技術(shù)通過(guò)將點(diǎn)投影到一個(gè)新的空間(稱為可達(dá)空間)來(lái)改進(jìn)標(biāo)準(zhǔn)的單鏈接聚類,該空間將噪聲從密集區(qū)域進(jìn)一步移開(kāi),使其更易于處理。然而,與許多其他層次聚集聚類方法(如單鏈接聚類和完全鏈接聚類)一樣, OPTICS 也存在以單個(gè)全局切割值切割生成的樹(shù)狀圖的缺點(diǎn)。 HDBSCAN 本質(zhì)上是光學(xué)+ DBSCAN ,引入了集群穩(wěn)定性的度量,以在不同級(jí)別上切割樹(shù)狀圖。

我們將通過(guò)快速示例演示 HDBSCAN 的 RAPIDS cuML 實(shí)現(xiàn)中當(dāng)前支持的功能,并將提供我們?cè)?GPU 上實(shí)現(xiàn)的一些實(shí)際示例和基準(zhǔn)。在閱讀了這篇博文之后,我們希望您對(duì) RAPIDS ‘ GPU – 加速 HDBSCAN 實(shí)施可以為您的工作流和探索性數(shù)據(jù)分析過(guò)程帶來(lái)的好處感到興奮。

RAPIDS 中的 HDBSCAN 入門

GPU 提供了一組 RAPIDS – 加速 CPU 庫(kù),幾乎可以替代 PyData 生態(tài)系統(tǒng)中許多流行的庫(kù)。下面的示例筆記本演示了 Python 上使用最廣泛的 HDBSCAN Python 庫(kù)與 GPU 上的 RAPIDS cuML HDBSCAN 之間的 API 兼容性(擾流板警報(bào)–在許多情況下,它與更改導(dǎo)入一樣簡(jiǎn)單)。


下面是一個(gè)非常簡(jiǎn)單的示例,演示了基于密度的聚類優(yōu)于基于質(zhì)心的技術(shù)對(duì)某些類型數(shù)據(jù)的好處,以及使用 HDBSCAN 優(yōu)于 DBSCAN 的好處。

HDBSCAN 在實(shí)踐中的應(yīng)用

基于密度的聚類技術(shù)自然適合于許多不同的聚類任務(wù),因?yàn)樗鼈兡軌蛘业叫螤钇嫣?、大小各異的聚類。與許多其他通用機(jī)器學(xué)習(xí)算法一樣,沒(méi)有免費(fèi)的午餐,因此盡管 HDBSCAN 改進(jìn)了一些成熟的算法,但它仍然不是完成這項(xiàng)工作的最佳工具。盡管如此, DBSCAN 和 HDBSCAN 在從地理空間和協(xié)同過(guò)濾/推薦系統(tǒng)到金融和科學(xué)計(jì)算等領(lǐng)域的應(yīng)用中取得了顯著的成功,被應(yīng)用于從天文學(xué)到加速器物理學(xué)到基因組學(xué)等學(xué)科。它對(duì)噪聲的魯棒性也使得它對(duì)于異常值和異常檢測(cè)應(yīng)用非常有用。

與數(shù)據(jù)分析和機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)中的許多其他工具一樣,計(jì)算時(shí)間對(duì)生產(chǎn)系統(tǒng)和迭代工作流有很大的影響。更快的 HDBSCAN 意味著能夠嘗試更多的想法并制作更好的模型。下面是幾個(gè)使用 HDBSCAN 對(duì)單詞嵌入和單細(xì)胞 RNA 基因表達(dá)進(jìn)行聚類的示例筆記本。這些都是為了簡(jiǎn)短,并為您自己的數(shù)據(jù)集使用 HDBSCAN 提供了一個(gè)很好的起點(diǎn)。您是否已成功地將 HDBSCAN 應(yīng)用于工業(yè)或科學(xué)領(lǐng)域,我們?cè)诖宋戳谐???qǐng)留下評(píng)論,因?yàn)槲覀兒芟肼?tīng)到。如果您在自己的硬件上運(yùn)行示例筆記本電腦,還請(qǐng)告知我們您的設(shè)置以及您使用 RAPIDS 的經(jīng)驗(yàn)。

單詞嵌入

向量嵌入代表了一種流行且非常廣泛的聚類機(jī)器學(xué)習(xí)應(yīng)用。我們之所以選擇 GoogleNews 數(shù)據(jù)集,是因?yàn)樗銐虼?,可以很好地顯示我們的算法的規(guī)模,但又足夠小,可以在一臺(tái)機(jī)器上執(zhí)行。下面的筆記本演示了如何使用 HDBSCAN 查找有意義的主題,這些主題來(lái)自單詞嵌入的角度空間中的高密度區(qū)域,并使用 UMAP 可視化生成的主題簇。它使用整個(gè)數(shù)據(jù)集的一個(gè)子集進(jìn)行可視化,但為調(diào)整不同的超參數(shù)和熟悉它們對(duì)結(jié)果集群的影響提供了一個(gè)很好的演示。我們使用默認(rèn)的超參數(shù)設(shè)置(形狀為 3Mx300 )對(duì)整個(gè)數(shù)據(jù)集進(jìn)行了基準(zhǔn)測(cè)試,并在 24 小時(shí)后停止了 CPU 上的 Scikit learn contrib 實(shí)現(xiàn)。 RAPIDS 的實(shí)現(xiàn)大約需要 22 .8 分鐘。


單細(xì)胞 RNA

下面是一個(gè)基于掃描和俱樂(lè)部庫(kù)中教程筆記本的工作流示例。本示例筆記本取自 RAPIDS 單單元示例存儲(chǔ)庫(kù),其中還包含幾個(gè)筆記本,演示了 RAPIDS 用于單細(xì)胞和三級(jí)分析。在 DGX-1 (英特爾 40 核至強(qiáng) CPU + NVIDIA V100 GPU )上,我們發(fā)現(xiàn) HDBSCAN (在 GPU 上是~ 1s ,而不是具有多個(gè) CPU 線程的~ 29s )使用了包含~ 70k 肺細(xì)胞基因表達(dá)的數(shù)據(jù)集上的前 50 個(gè)主成分,加速了 29x 。

RAPIDS CUML 項(xiàng)目包括端到端 GPU 加速的 HDBSCAN ,并提供 Python 和 C ++ + API 。與 cuML 中的許多基于鄰域的算法一樣,它利用 Facebook 的費(fèi)斯庫(kù)中的蠻力 kNN 來(lái)加速相互可達(dá)空間中 kNN 圖的構(gòu)建。這是目前的一個(gè)主要瓶頸,我們正在研究通過(guò)精確和近似近鄰選項(xiàng)進(jìn)一步改進(jìn)它的方法。

CUML 還包括單連鎖層次聚類的實(shí)現(xiàn),它提供了 C ++和 Python API 。 GPU – 加速單個(gè)鏈接算法需要計(jì)算最小生成樹(shù)的新原語(yǔ)。此原語(yǔ)基于圖形,因此可以在 cugraph 和 cuml 庫(kù)中重用。我們的實(shí)現(xiàn)允許重新啟動(dòng),這樣我們就可以連接一個(gè)斷開(kāi)連接的 knn 圖,并通過(guò)不必在 GPU 內(nèi)存中存儲(chǔ)整個(gè)成對(duì)距離矩陣來(lái)提高可伸縮性。

與大多數(shù)CUML算法中的C++一樣,這些依賴于我們的大多數(shù)基于ML和基于圖元的[VZX27 ]。最后,他們利用利蘭·麥克因內(nèi)斯和約翰·希利所做的偉大工作到 GPU ——甚至加快了群集壓縮和選擇步驟,使數(shù)據(jù)盡可能多地保留在 GPU 上,并在數(shù)據(jù)規(guī)模擴(kuò)展到數(shù)百萬(wàn)時(shí)提供額外的性能提升。

基準(zhǔn)

我們使用了 McInnes 等人在 CPU 上的參考實(shí)現(xiàn)提供的基準(zhǔn)筆記本,將其與 cuML 的新 GPU 實(shí)現(xiàn)進(jìn)行比較。參考實(shí)現(xiàn)針對(duì)低維情況進(jìn)行了高度優(yōu)化,我們將高維情況與大量使用 Facebook FAISS 庫(kù)的暴力實(shí)現(xiàn)進(jìn)行了比較。

圖 4 : GPU – 加速 HDBSCAN 即使對(duì)于大型數(shù)據(jù)集也能保持近乎交互的性能,同時(shí)消除 CPU 有限的并行性。有了這些速度,你會(huì)發(fā)現(xiàn)你有更多的時(shí)間做其他事情,比如更好地了解你的數(shù)據(jù)。

基準(zhǔn)測(cè)試是在 DGX-1 上執(zhí)行的,該 DGX-1 包含 40 核 Intel 至強(qiáng) CPU 和 NVIDIA 32gb V100 GPU s 。即使對(duì)維度數(shù)進(jìn)行線性縮放,對(duì)行數(shù)進(jìn)行二次縮放,我們觀察到 GPU 仍然保持接近交互性能,即使行數(shù)超過(guò) 1M 。

發(fā)生了什么變化?

雖然我們已經(jīng)成功地在 GPU 上實(shí)現(xiàn)了 HDBSCAN 算法的核心,但仍有機(jī)會(huì)進(jìn)一步提高其性能,例如通過(guò)加快蠻力 kNN 圖構(gòu)造刪除距離計(jì)算,甚至使用近似 kNN。雖然歐幾里德距離涵蓋了最廣泛的用途,但我們還想公開(kāi)Scikit 學(xué)習(xí) Contrib 實(shí)現(xiàn)中提供的其他距離度量。

scikit learn contrib 實(shí)現(xiàn)還包含許多不錯(cuò)的附加功能,這些功能沒(méi)有包含在 HDBSCAN 上的開(kāi)創(chuàng)性論文中,例如半監(jiān)督和模糊聚類。我們也有堅(jiān)固的單連桿和光學(xué)算法的構(gòu)建塊,這將是 RAPIDS 未來(lái)的良好補(bǔ)充。最后,我們希望在將來(lái)支持稀疏輸入。

如果您發(fā)現(xiàn)這些功能中的一個(gè)或多個(gè)可以使您的應(yīng)用程序或數(shù)據(jù)分析項(xiàng)目更成功,即使此處未列出這些功能,請(qǐng)轉(zhuǎn)到我們的Github 項(xiàng)目并創(chuàng)建一個(gè)問(wèn)題。

概括

HDBSCAN 是一種相對(duì)較新的基于密度的聚類算法“站在巨人的肩膀上”,改進(jìn)了著名的 DBSCAN 和光學(xué)算法。事實(shí)上,它的核心原語(yǔ)還增加了重用,并為其他算法提供了構(gòu)建塊,例如基于圖的最小生成樹(shù)和 RAPIDS ML 和圖庫(kù)中的單鏈接聚類。

與其他數(shù)據(jù)建模算法一樣, HDBSCAN 并不是所有工作的完美工具,但它在工業(yè)和科學(xué)計(jì)算應(yīng)用中都有很多實(shí)際用途。它還可以與 PCA 或 UMAP 等降維算法配合使用,尤其是在探索性數(shù)據(jù)分析應(yīng)用中。

關(guān)于作者

Corey Nolet 是 NVIDIA 的 RAPIDS ML 團(tuán)隊(duì)的數(shù)據(jù)科學(xué)家兼高級(jí)工程師,他專注于構(gòu)建和擴(kuò)展機(jī)器學(xué)習(xí)算法,以支持光速下的極端數(shù)據(jù)負(fù)載。在 NVIDIA 工作之前, Corey 花了十多年時(shí)間為國(guó)防工業(yè)的 HPC 環(huán)境構(gòu)建大規(guī)模探索性數(shù)據(jù)科學(xué)和實(shí)時(shí)分析平臺(tái)??评锍钟杏?guó)理工學(xué)士學(xué)位計(jì)算機(jī)科學(xué)碩士學(xué)位。他還在攻讀博士學(xué)位。在同一學(xué)科中,主要研究圖形和機(jī)器學(xué)習(xí)交叉點(diǎn)的算法加速??评餆嶂杂诶脭?shù)據(jù)更好地了解世界。

Divye Gala 是 NVIDIA 的 RAPIDS 團(tuán)隊(duì)的高級(jí)軟件工程師,在 GPU 上開(kāi)發(fā)用于機(jī)器學(xué)習(xí)和圖形分析的快速可擴(kuò)展算法。 Divye 持有女士和 Bs 。計(jì)算機(jī)科學(xué)學(xué)位。在空閑時(shí)間,迪維喜歡踢足球和看板球。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10698

    瀏覽量

    209338
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4590

    瀏覽量

    128138
  • API
    API
    +關(guān)注

    關(guān)注

    2

    文章

    1461

    瀏覽量

    61489
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    GPU加速matlab程序

    最近遇到了一個(gè)加速matlab程序的問(wèn)題,不知道如何利用GPU,以及使用GPU的先決條件,是不是GPU加速必須要用cuda,最重要的是只用G
    發(fā)表于 03-30 11:21

    tengine是如何使用arm的GPU進(jìn)行加速

    【嵌入式AI】多目標(biāo)分類檢測(cè)系統(tǒng)實(shí)戰(zhàn)中,tengine是如何使用arm的GPU進(jìn)行加速的,這個(gè)原理能詳細(xì)說(shuō)明一下嗎?
    發(fā)表于 09-02 14:18

    NVIDIA推出RAPIDS開(kāi)源GPU加速平臺(tái)

    HPE、IBM、Oracle、開(kāi)源社區(qū)、創(chuàng)業(yè)公司采用RAPIDS,顯著提升端到端預(yù)測(cè)數(shù)據(jù)分析能力。
    的頭像 發(fā)表于 10-17 14:36 ?4247次閱讀

    Nvidia宣布推出了一套新的開(kāi)源RAPIDS庫(kù)

    在德國(guó)慕尼黑舉行的GPU技術(shù)會(huì)議上,高性能GPU和人工智能領(lǐng)域的領(lǐng)導(dǎo)者Nvidia宣布推出了一套新的開(kāi)源RAPIDS庫(kù),用于GPU加速的分析
    的頭像 發(fā)表于 03-25 15:38 ?2259次閱讀

    NVIDIA RAPIDS加速器可將工作分配集群中各節(jié)點(diǎn)

    近期,該團(tuán)隊(duì)在 GPU 助力的服務(wù)器上測(cè)試了適用于 Apache Spark 的 NVIDIA RAPIDS 加速器,該軟件可將工作分配到集群中的各節(jié)點(diǎn)。
    的頭像 發(fā)表于 04-01 14:15 ?1042次閱讀

    如何使用RAPIDS和CuPy時(shí)加速Gauss 秩變換

    將展示如何使用 RAPIDS cuDF 和 Chainer CuPy 實(shí)現(xiàn) GPU 加速的 Gauss 秩變換,并使用 pandas 和 NumPy 替換來(lái)實(shí)現(xiàn) 100 倍加速 。
    的頭像 發(fā)表于 04-20 10:37 ?1466次閱讀
    如何使用<b class='flag-5'>RAPIDS</b>和CuPy時(shí)<b class='flag-5'>加速</b>Gauss 秩變換

    NVIDIA RAPIDS加速器v21.08的功能應(yīng)用

      我們通過(guò)處理 GPU 內(nèi)存溢出的數(shù)據(jù)集以進(jìn)行分組和窗口操作,繼續(xù)改善用戶體驗(yàn)。這一改進(jìn)將節(jié)省用戶創(chuàng)建分區(qū)的時(shí)間,以避免 GPU 上出現(xiàn)內(nèi)存不足錯(cuò)誤。類似地, UCX 1.11 的采用改進(jìn)了 RAPIDS Spark
    的頭像 發(fā)表于 04-20 14:58 ?1412次閱讀
    NVIDIA <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>器v21.08的功能應(yīng)用

    RAPIDS cuML中的輸入輸出可配置性

      使用現(xiàn)有 NumPy 、 Scikit-learn 和傳統(tǒng)的基于 PyData 庫(kù)的工作流的用戶: cuML 的默認(rèn)行為,允許盡可能多的格式,以及其基于 Scikit-learn 的 API
    的頭像 發(fā)表于 04-24 16:32 ?1178次閱讀
    <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuML</b>中的輸入輸出可配置性

    AutoML技術(shù)提高NVIDIA GPURAPIDS速度

      AutoGluon AutoML 工具箱使培訓(xùn)和部署尖端技術(shù)變得很容易 復(fù)雜業(yè)務(wù)問(wèn)題的精確機(jī)器學(xué)習(xí)模型。此外, AutoGluon 與 RAPIDS 的集成充分利用了 NVIDIA GPU 計(jì)算的潛力,使復(fù)雜模型的訓(xùn)練速度提高了 40 倍,預(yù)測(cè)速度提高了 10 倍。
    的頭像 發(fā)表于 04-26 16:01 ?1970次閱讀
    AutoML技術(shù)提高NVIDIA <b class='flag-5'>GPU</b>和<b class='flag-5'>RAPIDS</b>速度

    利用Apache Spark和RAPIDS Apache加速Spark實(shí)踐

      在第三期文章中,我們?cè)敿?xì)介紹了如何充分利用 Apache Spark 和 Apache RAPIDS 加速器 Spark 。 大多數(shù)團(tuán)隊(duì)都會(huì)通過(guò)干凈地使用 Spark 的數(shù)據(jù)幀抽象來(lái)實(shí)現(xiàn)最大
    的頭像 發(fā)表于 04-26 17:39 ?1748次閱讀
    利用Apache Spark和<b class='flag-5'>RAPIDS</b> Apache<b class='flag-5'>加速</b>Spark實(shí)踐

    基于隨機(jī)分區(qū)的超快并行DBSCAN算法介紹

    本文提出采用隨機(jī)劃分策略并行運(yùn)行DBSCAN。為此,提出了一種基于單元格的數(shù)據(jù)分割策略,即偽隨機(jī)劃分,它具有區(qū)域劃分策略和隨機(jī)劃分策略的優(yōu)點(diǎn)。為了能夠在隨機(jī)分割上執(zhí)行區(qū)域查詢,本文設(shè)計(jì)了兩級(jí)單元格
    的頭像 發(fā)表于 08-02 18:14 ?2235次閱讀
    基于隨機(jī)分區(qū)的超快并行<b class='flag-5'>DBSCAN</b>算法介紹

    使用RAPIDS加速KubeFlow上的ETL

      在 機(jī)器學(xué)習(xí) 和 MLOps world , GPU 被廣泛用于加速模型訓(xùn)練和推理,但工作流的其他階段(如 ETL 管道或超參數(shù)優(yōu)化)如何?
    的頭像 發(fā)表于 10-11 10:37 ?925次閱讀
    使用<b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>KubeFlow上的ETL

    使用 RAPIDS 進(jìn)行更快的單細(xì)胞分析

    使用 RAPIDS-singlecell 進(jìn)行 GPU 加速的單細(xì)胞 RNA 分析
    的頭像 發(fā)表于 07-05 16:30 ?597次閱讀
    使用 <b class='flag-5'>RAPIDS</b> 進(jìn)行更快的單細(xì)胞分析

    RAPIDS生成用于加速短期價(jià)格預(yù)測(cè)的限價(jià)訂單簿數(shù)據(jù)集

    RAPIDS 生成用于加速短期價(jià)格預(yù)測(cè)的限價(jià)訂單簿數(shù)據(jù)集
    的頭像 發(fā)表于 07-05 16:30 ?467次閱讀
    用<b class='flag-5'>RAPIDS</b>生成用于<b class='flag-5'>加速</b>短期價(jià)格預(yù)測(cè)的限價(jià)訂單簿數(shù)據(jù)集

    如何用基于NVIDIA GPURAPIDS cuML實(shí)現(xiàn)取代KRR?

    使用 NVIDIA RAPIDS cuML 實(shí)現(xiàn) 100 倍更快的單電池模式預(yù)測(cè)
    的頭像 發(fā)表于 07-05 16:30 ?595次閱讀
    如何用基于NVIDIA <b class='flag-5'>GPU</b>的<b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuML</b>實(shí)現(xiàn)取代KRR?