0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

LinkedIn機器學習解決方案

汽車玩家 ? 來源:今日頭條 ? 作者:聞數(shù)起舞 ? 2020-05-03 18:37 ? 次閱讀

LinkedIn已實現(xiàn)了非常先進的體系結構,可大規(guī)模開發(fā)機器學習解決方案。

對于大多數(shù)組織而言,構建基礎結構來管理機器學習模型的生命周期仍然是一個挑戰(zhàn)。 盡管我們已經(jīng)看到了機器/深度學習框架的巨大進步,但對于大多數(shù)開始機器學習之旅的團隊來說,大規(guī)模開發(fā),部署和管理模型的架構最佳實踐仍然有些障礙。 為了掌握其中的一些架構最佳實踐,我們應該看看機器學習創(chuàng)新正在發(fā)生什么。 那是在大型技術公司內部。 微軟,谷歌,F(xiàn)acebook,優(yōu)步,LinkedIn和Netflix已經(jīng)開發(fā)了一些市場上最先進的機器學習基礎設施。 今天,我想在LinkedIn上探索支持某些關鍵任務機器學習工作流程的架構。

LinkedIn是將機器學習應用于大規(guī)模場景多年的公司之一,但對該軟件巨頭使用的特定方法和技術知之甚少。 最近,LinkedIn工程團隊發(fā)布了一系列博客文章,提供了有關其機器學習基礎結構和實踐的一些非常有趣的見解。 盡管許多情況都是特定于LinkedIn的,但是這些技術和最佳實踐適用于許多大規(guī)模的機器學習解決方案。

人與人之間的機器學習

LinkedIn機器學習架構最有趣的方面之一是他們如何利用人作為機器學習工作流程的一部分。 例如,假設一個場景發(fā)現(xiàn)了不同標題之間的關系,例如" 高級軟件工程師"或"首席開發(fā)人員"來改善搜索體驗。 LinkedIn使用人類分類學家來標記標題之間的關系,以便可以將它們用于機器學習模型(例如長時記憶網(wǎng)絡)中,以幫助發(fā)現(xiàn)標題之間的其他關系。 機器學習架構是LinkedIn知識圖的基礎。

大規(guī)模的機器學習基礎架構

LinkedIn機器學習基礎架構的核心是一個稱為Pro-ML的專有系統(tǒng)。 從概念上講,Pro-ML控制著機器學習模型從訓練到監(jiān)視的整個生命周期。 為了擴展Pro-ML,LinkedIn建立了一個架構,該架構將其一些開源技術(例如Kafka或Samza)與基礎結構構建塊(例如Spark或Hadoop YARN)相結合。

LinkedIn機器學習解決方案

盡管LinkedIn機器學習堆棧中使用的大多數(shù)技術都是眾所周知的,但還有一些新的貢獻值得進一步探索:

·Ambry:LinkedIn的Ambry是一個分布式的不可變blob存儲系統(tǒng),具有高可用性,易于擴展,經(jīng)過優(yōu)化,可以以高吞吐量和低延遲為大小從幾個KB到多個GB的不可變對象提供服務,并能夠從客戶端進行端到端流傳輸?shù)酱鎯?,反之亦然?該系統(tǒng)旨在跨多個數(shù)據(jù)中心在主動-主動設置下工作,并提供非常便宜的存儲。

·TonY:YARN上的TensorFlow(TonY)是一個框架,可在Apache Hadoop上本地運行TensorFlow。 TonY支持將單個節(jié)點或分布式TensorFlow訓練作為Hadoop應用程序運行。

·PhotonML:PhotonML是基于Apache Spark的機器學習庫。 當前,Photon ML支持訓練不同類型的廣義線性模型(GLM)和廣義線性混合模型(GLMMs / GLMix模型):邏輯,線性和泊松。

Hadoop上的TensorFlow

上個月,LinkedIn工程團隊在YARN(TonY)框架上開源了其TensorFlow的第一版。 該版本的目標是使TensorFlow程序能夠在分布式YARN群集上運行。 盡管TensorFlow工作流在諸如Apache Spark之類的基礎架構上得到廣泛支持,但YARN在很大程度上仍被機器學習社區(qū)所忽略。 一流的支持,可通過處理諸如資源協(xié)商和容器環(huán)境設置之類的任務在Hadoop上運行TensorFlow作業(yè)。

LinkedIn機器學習解決方案

TonY的核心是使用TensorFlow程序并將其拆分為可以在YARN集群上執(zhí)行的多個并行任務。 這樣做是在完全支持TensorFlow的計算圖的同時,這意味著TensorBoard之類的工具可以在TonY上使用,而無需進行任何修改。

LinkedIn機器學習解決方案

TonY是對TensorFlow生態(tài)系統(tǒng)的有趣貢獻,可以改善TensorFlow應用程序大規(guī)模運行的體驗。 此外,TonY可以從YARN生態(tài)系統(tǒng)中可用的大量工具和庫中受益,從而為訓練和運行TensorFlow應用程序提供高度可擴展的運行時。

測試

LinkedIn運行著數(shù)以千計的并發(fā)機器學習模型,這些模型正在不斷發(fā)展和版本化。 在這些情況下,開發(fā)健壯的測試方法對于優(yōu)化運行時機器學習模型的性能至關重要。 就LinkedIn而言,工程團隊已將A / B測試作為其Pro-ML架構的一等公民,使機器學習工程師可以針對特定情況部署競爭算法并評估產(chǎn)生最佳結果的算法。

像LinkedIn這樣的互聯(lián)網(wǎng)巨頭站在大規(guī)模機器學習解決方案實施的最前沿,他們對這一主題的見解對于開始他們的機器學習之旅的公司來說具有不可思議的價值。 LinkedIn的工作清楚地表明,大規(guī)模開發(fā)機器學習是一項永無止境的練習,它將流行的開源庫和平臺與專有框架和方法相結合。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8353

    瀏覽量

    132315
  • LinkedIn
    +關注

    關注

    0

    文章

    18

    瀏覽量

    14459
收藏 人收藏

    評論

    相關推薦

    AI干貨補給站 | 深度學習機器視覺的融合探索

    在智能制造的浪潮中,阿丘科技作為業(yè)界領先的工業(yè)AI視覺平臺及解決方案提供商,始終致力于推動AI+機器視覺技術的革新與應用。為此,我們特別開設了「AI干貨補給站」專欄,分享此領域的基礎知識及實踐經(jīng)驗
    的頭像 發(fā)表于 10-29 08:04 ?166次閱讀
    AI干貨補給站 | 深度<b class='flag-5'>學習</b>與<b class='flag-5'>機器</b>視覺的融合探索

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數(shù)據(jù)中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發(fā)表于 07-02 11:25 ?672次閱讀

    深度學習與傳統(tǒng)機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發(fā)表于 07-01 11:40 ?1101次閱讀

    請問PSoC? Creator IDE可以支持IMAGIMOB機器學習嗎?

    。 我發(fā)現(xiàn)IMAGIMOB 是一個很好的解決方案來滿足我的需求,但現(xiàn)在的問題是, PSoC? Creator 不支持 IMAGIMOB! PSoC? Creator 可以支持機器學習或 IMAGIMOB 嗎?
    發(fā)表于 05-20 08:06

    英飛凌收購Imagimob,擴大AI產(chǎn)品,提升邊緣設備機器學習

    英飛凌安全互聯(lián)系統(tǒng)事業(yè)部總裁托馬斯·羅斯泰克先生表示:“AI和機器學習正在引領各類嵌入式應用,帶來全新功能。借助Imagimob出色的研發(fā)能力和在邊緣設備強大ML解決方案研發(fā)上的卓越成就
    的頭像 發(fā)表于 04-29 11:27 ?314次閱讀

    深度學習與度量學習融合的綜述

    如今,機器學習的應用廣泛,包括人臉識別、醫(yī)療診斷等,為復雜問題和大量數(shù)據(jù)提供解決方案。機器學習算法能基于數(shù)據(jù)產(chǎn)生成功的分類模型,但每個數(shù)據(jù)都
    發(fā)表于 04-24 09:49 ?371次閱讀
    深度<b class='flag-5'>學習</b>與度量<b class='flag-5'>學習</b>融合的綜述

    機器學習(ML)推理主要計算之存內計算芯片

    機器學習(ML)應用已經(jīng)在汽車、醫(yī)療保健、金融和技術等各個領域變得無處不在。這導致對高性能、高能效 ML 硬件解決方案的需求不斷增加。
    發(fā)表于 04-07 10:48 ?1008次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>(ML)推理主要計算之存內計算芯片

    人工智能和機器學習的頂級開發(fā)板有哪些?

    設備不必再依賴遠程服務器或云來洞察傳感器數(shù)據(jù)或用戶輸入。像TinyML這樣的軟件框架正在發(fā)展成為微控制器專用的機器學習解決方案,而傳統(tǒng)的深度學習框架也可以在功能強
    的頭像 發(fā)表于 02-29 18:59 ?724次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的頂級開發(fā)板有哪些?

    機器視覺運動控制一體機在光伏匯流焊機器人系統(tǒng)的解決方案

    一體機結合SCARA機械手+機器視覺的電池片匯流焊解決方案??山鉀Q不同角度來料、規(guī)格等光伏太陽能電池板的串焊需求,實現(xiàn)生產(chǎn)效率和精度等大幅提升,同時將廢品率降至僅12%,并顯著加快數(shù)據(jù)處理速度,提高了
    發(fā)表于 02-28 15:01

    如何使用TensorFlow構建機器學習模型

    在這篇文章中,我將逐步講解如何使用 TensorFlow 創(chuàng)建一個簡單的機器學習模型。
    的頭像 發(fā)表于 01-08 09:25 ?895次閱讀
    如何使用TensorFlow構建<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型

    基于MCX微控制器的機器學習解決方案

    隨著人工智能(AI)技術的發(fā)展,如何在MCU上實現(xiàn)機器學習,創(chuàng)造更多邊緣AI的新用例,一直是嵌入式開發(fā)社區(qū)的熱點話題。
    的頭像 發(fā)表于 01-05 09:18 ?714次閱讀
    基于MCX微控制器的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>解決方案</b>

    蔡司三坐標工業(yè)CT制造領域解決方案

    今天蔡司三本精密儀器小編為大家?guī)聿趟救鴺斯I(yè)CT制造領域解決方案。首先揭秘的是精密實驗室應用場景,這里一共有6大解決方案展示區(qū),關注于精密測量熱點疑難問題的解決。一、機器人減速器解決方案
    的頭像 發(fā)表于 01-02 18:10 ?418次閱讀
    蔡司三坐標工業(yè)CT制造領域<b class='flag-5'>解決方案</b>

    科聰料箱移動機器人整體解決方案

    。料箱機器人現(xiàn)場作業(yè)料箱機器人構成科聰料箱機器人整體解決方案料箱式移動機器人整體解決方案,根據(jù)移
    的頭像 發(fā)表于 12-19 16:32 ?681次閱讀
    科聰料箱移動<b class='flag-5'>機器</b>人整體<b class='flag-5'>解決方案</b>

    微軟暫緩LinkedIn上云項目,轉向自建數(shù)據(jù)中心投資

    LinkedIn早在2019年即宣布了“藍色轉換”的云遷移計劃,然而據(jù)知情人士透露,實際上項目已在去年停止推進。相關文件表明,LinkedIn當時的首席技術官Raghu Hiremagalur在去年告知研發(fā)團隊要集中精力擴大和創(chuàng)新“本地基礎設施”。
    的頭像 發(fā)表于 12-15 10:56 ?565次閱讀

    科聰停車移動機器人整體解決方案!

    解決方案:本方案中核心部分采用的是科聰通用移動機器人控制器,導航方式一般選擇激光導航,用以實現(xiàn)行駛路徑可靈活多變和高精度導航的需求。以通用移動機器人控制器為核心的整體解
    的頭像 發(fā)表于 11-30 10:45 ?641次閱讀
    科聰停車移動<b class='flag-5'>機器</b>人整體<b class='flag-5'>解決方案</b>!