0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

InfoQ 2023 年趨勢報告:數(shù)據(jù)工程、AI 和 ML

jf_WZTOguxH ? 來源:AI前線 ? 2023-09-27 15:47 ? 次閱讀

InfoQ 趨勢報告為 InfoQ 讀者提供了一個關于我們認為架構師和技術領導者應該關注的主題的高層級概述。此外,它們還可以幫助 InfoQ 的編輯團隊專注于撰寫新聞和招募文章作者來報道創(chuàng)新技術。

在這份年度報告中,InfoQ 的編輯們討論了人工智能AI)、機器學習(ML)和數(shù)據(jù)工程的現(xiàn)狀,以及作為軟件工程師、架構師或數(shù)據(jù)科學家應該關注的新興趨勢。文章將編輯們的討論整理成了一條技術采用曲線,并提供了支持性評論,以幫助大家了解事物是如何演進的。

在今年的播客(podcast) 中,來自 Chime 的軟件工程師 Sherin Thomas 加入了 InfoQ 編輯團隊。本文中下面的內(nèi)容總結(jié)了其中的一些趨勢,以及不同技術在技術采用曲線中的位置。

a92c6616-5cf7-11ee-939d-92fbcf53809c.png

生成式 AI

生成式 AI,包括 GPT-3、GPT-4 和 Chat GPT 等大語言模型,現(xiàn)已成為人工智能(AI)和機器學習(ML)行業(yè)的主要力量。這些技術已經(jīng)引起了極大的關注,特別是考慮到它們在過去一年中取得的進展。我們已經(jīng)看到這些技術被用戶廣泛采用,特別是在 ChatGPT 的推動下。谷歌和 Meta 等多家公司已經(jīng)宣布了自己的生成式 AI 模型。

我們期望的下一步是更多地關注 LLMOps,以便在企業(yè)環(huán)境中操作這些大語言模型。對于 prompt 工程是否會成為未來的一個大主題,或者它是否會被廣泛采用以至于每個人都能夠為自己所使用的 prompt 做出貢獻,我們存在分歧。

向量數(shù)據(jù)庫和嵌入存儲

隨著 LLM 技術的興起,人們越來越關注向量數(shù)據(jù)庫和嵌入存儲。一個吸引人的應用是使用句子嵌入來增強生成式 AI 應用程序的可觀察性。

對向量搜索數(shù)據(jù)庫的需求源于大語言模型的限制,這些模型具有有限的 token 歷史記錄。向量數(shù)據(jù)庫可以將文檔摘要存儲為這些語言模型生成的特征向量,從而可能產(chǎn)生數(shù)百萬或更多的特征向量。對于傳統(tǒng)數(shù)據(jù)庫,隨著數(shù)據(jù)集的增長,查找相關文檔會變得很有挑戰(zhàn)性。向量搜索數(shù)據(jù)庫實現(xiàn)了高效的相似性搜索,允許用戶定位查詢向量的最近鄰居,從而增強了搜索過程。

一個顯著的趨勢是對這些技術的投資激增,這表明投資者認識到了它們的重要性。然而,開發(fā)人員的采用速度較慢,但預計在未來幾年會加快。Pinecone、Milvus 等向量搜索數(shù)據(jù)庫和 Chroma 等開源解決方案正在獲得關注。數(shù)據(jù)庫的選擇取決于特定的應用程序和所搜索數(shù)據(jù)的性質(zhì)。

在包括對地觀測在內(nèi)的各個領域,向量數(shù)據(jù)庫已顯示出它的潛在實力。例如,美國國家航空航天局(NASA)利用自監(jiān)督學習和向量搜索技術來分析地球的衛(wèi)星圖像,以幫助科學家追蹤颶風等天氣現(xiàn)象。

機器人無人機技術

機器人的成本正在下降。過去,腿型平衡機器人很難實現(xiàn),但現(xiàn)在已經(jīng)有一些型號的機器人售價約為 1500 美元。這使得更多的用戶可以在他們的應用程序中使用機器人技術。機器人操作系統(tǒng)ROS)仍然是該領域的領先軟件框架,但像 VIAM 這樣的公司也在開發(fā)中間件解決方案,以使集成和配置機器人開發(fā)插件變得更加容易。

我們預計,無監(jiān)督學習和基礎模型的進步將轉(zhuǎn)化為能力的提升。例如,通過將大語言模型集成到機器人的路徑規(guī)劃中,以實現(xiàn)使用自然語言來進行規(guī)劃。

負責任且合乎道德的人工智能

隨著人工智能開始影響全人類,人們對負責任且合乎道德的人工智能越來越感興趣。人們同時呼吁對大語言模型進行更嚴格的安全保護,同時也對此類模型提醒用戶的現(xiàn)有保障措施輸出感到沮喪。

對于工程師來說,重要的是要牢記需要改善所有人的生活,而不僅僅是改善少數(shù)人的生活。我們預計人工智能監(jiān)管將產(chǎn)生與幾年前 GDPR 類似的影響。

我們已經(jīng)看到一些人工智能因為糟糕的數(shù)據(jù)而失敗。數(shù)據(jù)發(fā)現(xiàn)、操作、數(shù)據(jù)沿襲、標記和良好的模型開發(fā)實踐將成為中心。數(shù)據(jù)對可解釋性至關重要。

數(shù)據(jù)工程

現(xiàn)代數(shù)據(jù)工程的特點是動態(tài)地轉(zhuǎn)向更加分散和靈活的方法來管理不斷增長的數(shù)據(jù)量。數(shù)據(jù)網(wǎng)格(Data Mesh) 是一個新穎的概念,它的出現(xiàn)是為了解決集中式數(shù)據(jù)管理團隊成為數(shù)據(jù)運營瓶頸所帶來的挑戰(zhàn)。它主張建立一個跨域分區(qū)的聯(lián)邦數(shù)據(jù)平臺,將數(shù)據(jù)視為一種產(chǎn)品。這允許域所有者擁有對其數(shù)據(jù)產(chǎn)品的所有權和控制權,從而減少了對中心團隊的依賴。盡管數(shù)據(jù)網(wǎng)格的采用前景廣闊,但可能面臨與專業(yè)知識相關的障礙,需要先進的工具和基礎設施來實現(xiàn)自助服務功能。

數(shù)據(jù)可觀察性在數(shù)據(jù)工程中已經(jīng)變得至關重要,類似于應用程序架構中的系統(tǒng)可觀察性。可觀察性在所有層面上都是必不可少的,包括數(shù)據(jù)的觀察性,尤其是在機器學習的背景下。對數(shù)據(jù)的信任是人工智能成功的關鍵,數(shù)據(jù)可觀察性解決方案對于監(jiān)測數(shù)據(jù)質(zhì)量、模型漂移和探索性數(shù)據(jù)分析至關重要,以確??煽康臋C器學習結(jié)果。數(shù)據(jù)管理的這種范式轉(zhuǎn)變以及跨數(shù)據(jù)和機器學習(ML)管道的可觀察性集成反映了現(xiàn)代數(shù)據(jù)工程的發(fā)展前景。

曲線的更新的相關解釋

這份趨勢報告還提供了一張更新的圖表,顯示了我們對某些技術的看法。這些類別基于 Geoffrey Moore 的 《跨越鴻溝》(“Crossing the Chasm”) 一書。在 InfoQ,我們主要關注那些尚未跨越鴻溝的類別。

從創(chuàng)新者到早期采用者的一個顯著升級是“人工智能編碼助手”。盡管它們在過去一年非常新,幾乎沒有使用過,但我們看到越來越多的公司將其作為一項服務提供給員工,以提高他們的效率。它并不是每個技術棧的默認部分,我們?nèi)栽谔剿魅绾巫钣行У厥褂盟鼈?,但我們相信其采用率將會繼續(xù)增長。

我們認為現(xiàn)在正在跨越鴻溝的是自然語言處理。這對任何人來說都不會感到驚訝,因為在 ChatGPT 取得巨大成功之后,許多公司目前都在試圖找出如何在他們的產(chǎn)品中采用生成式人工智能的功能。因此,我們決定讓它跨越鴻溝,進入早期多數(shù)的類別。它在這里仍然有很大的增長潛力,時間會告訴我們更多關于這項技術的最佳實踐和能力。

有一些值得注意的類別根本沒有移動。這些技術包括合成數(shù)據(jù)生成、腦機接口和機器人技術。所有這些似乎都一直被困在創(chuàng)新者的范疇里。在這方面最有希望的是合成數(shù)據(jù)生成主題,最近隨著 GenAI 的炒作,該主題受到越來越多的關注。我們確實看到越來越多的公司在談論生成更多的訓練數(shù)據(jù),但還沒有看到足夠多的應用程序在它們的技術棧中實際使用這些數(shù)據(jù)來保證它進入到早期采用者的類別。多年來,機器人技術一直備受關注,但它的采用率仍然太低,我們無法保證它的發(fā)展。

我們還在圖中引入了幾個新的類別。一個值得注意的是向量搜索數(shù)據(jù)庫,這是 GenAI 炒作的副產(chǎn)品。隨著我們對如何將概念表示為向量有了更多的理解,我們也更需要有效地存儲和檢索所述向量。我們還將可解釋的人工智能添加到創(chuàng)新者的類別中。我們相信,計算機解釋它們?yōu)槭裁磿龀瞿硞€決定,對于廣泛采用以對抗幻覺和其他危險至關重要。然而,我們目前還沒有看到足夠的行業(yè)工作來保證它進入更高的類別。

結(jié) 論

人工智能(AI)、機器學習(ML)和數(shù)據(jù)工程領域每年都在不斷發(fā)展。在技術能力和可能的應用方面仍有很大的增長。對于我們 InfoQ 的編輯來說,能夠如此接近這一進展是令人興奮的,我們期待著明年能做出同樣的報告。在播客中,我們對未來一年做了一些預測,從“將不會有 AGI”到“自動代理將成為一件事”。我們希望你喜歡聽播客并閱讀這篇文章,并希望能在本文的下面看到你的預測和評論。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)庫

    關注

    7

    文章

    3752

    瀏覽量

    64235
  • 人工智能
    +關注

    關注

    1791

    文章

    46671

    瀏覽量

    237142
  • 機器學習
    +關注

    關注

    66

    文章

    8353

    瀏覽量

    132315

原文標題:InfoQ 2023 年趨勢報告:數(shù)據(jù)工程、AI 和 ML

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    中興通訊發(fā)布2023可持續(xù)發(fā)展報告

    近日,中興通訊發(fā)布2023度可持續(xù)發(fā)展報告,報告全面展現(xiàn)了2023中興通訊秉承“數(shù)字經(jīng)濟筑路
    的頭像 發(fā)表于 09-14 14:33 ?1320次閱讀

    一圖讀懂泰凌微電子2023年年度報告

    一圖讀懂泰凌微電子2023年年度報告
    的頭像 發(fā)表于 05-22 10:30 ?407次閱讀
    一圖讀懂泰凌微電子<b class='flag-5'>2023</b><b class='flag-5'>年年度報告</b>

    華為重磅發(fā)布2023全球DDoS攻擊現(xiàn)狀與趨勢分析報告

    近日,華為聯(lián)合天翼安全科技有限公司、聯(lián)通數(shù)科安全、百度安全、Nexusguard、中國移動云能力中心、中國移動卓望公司、清華大學共同發(fā)布《2023全球DDoS攻擊現(xiàn)狀與趨勢分析》(以下簡稱《
    的頭像 發(fā)表于 05-21 09:56 ?653次閱讀

    2023全球元器件假貨報告,哪個品牌最多假貨?

    ,2020和2021假貨數(shù)量大幅下降,很可能是新冠疫情引發(fā)供應鏈關閉的結(jié)果。盡管全球半導體銷售呈下降趨勢,但過去兩(2022
    的頭像 發(fā)表于 05-16 08:04 ?213次閱讀
    <b class='flag-5'>2023</b><b class='flag-5'>年</b>全球元器件假貨<b class='flag-5'>報告</b>,哪個品牌最多假貨?

    2023光伏行業(yè)發(fā)展回顧報告

    電子發(fā)燒友網(wǎng)站提供《2023光伏行業(yè)發(fā)展回顧報告.pdf》資料免費下載
    發(fā)表于 04-30 11:32 ?35次下載

    一圖讀懂芯導科技2023年年度報告

    一圖讀懂芯導科技2023年年度報告
    的頭像 發(fā)表于 04-16 14:18 ?349次閱讀
    一圖讀懂芯導科技<b class='flag-5'>2023</b><b class='flag-5'>年年度報告</b>

    理想汽車發(fā)布2023ESG報告

    20244月12日,理想汽車發(fā)布《2023環(huán)境、社會及管治報告》(簡稱“ESG報告”),從“合規(guī)經(jīng)營 責任管理”“創(chuàng)新先行 卓越產(chǎn)品”“
    的頭像 發(fā)表于 04-14 10:22 ?1224次閱讀

    一圖看懂艾為電子2023年年度報告

    一圖看懂艾為電子2023年年度報告
    的頭像 發(fā)表于 04-10 11:27 ?490次閱讀
    一圖看懂艾為電子<b class='flag-5'>2023</b><b class='flag-5'>年年度報告</b>

    芯原股份正式發(fā)布《2023社會責任報告

    芯原股份正式發(fā)布《2023社會責任報告》,敘述了芯原2023在追求經(jīng)營績效的同時,積極踐行社會責任的工作成果,主動回應利益相關方及社會各
    的頭像 發(fā)表于 04-01 09:32 ?443次閱讀
    芯原股份正式發(fā)布《<b class='flag-5'>2023</b><b class='flag-5'>年</b>社會責任<b class='flag-5'>報告</b>》

    是德科技推出AI數(shù)據(jù)中心測試平臺旨在加速AI/ML網(wǎng)絡驗證和優(yōu)化的創(chuàng)新

    20242月29日,是德科技(Keysight Technologies,Inc.)宣布,針對人工智能(AI)和機器學習(ML)基礎設施生態(tài)系統(tǒng),推出了 AI
    的頭像 發(fā)表于 02-29 09:32 ?571次閱讀
    是德科技推出<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)</b>中心測試平臺旨在加速<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>網(wǎng)絡驗證和優(yōu)化的創(chuàng)新

    佐思汽研發(fā)布《2023-2024汽車AI大模型技術和應用趨勢報告

    2023以來,越來越多車型開始接入大模型,越來越多Tier1推出汽車大模型解決方案。
    的頭像 發(fā)表于 02-28 14:21 ?3008次閱讀
    佐思汽研發(fā)布《<b class='flag-5'>2023</b>-2024<b class='flag-5'>年</b>汽車<b class='flag-5'>AI</b>大模型技術和應用<b class='flag-5'>趨勢</b><b class='flag-5'>報告</b>》

    深入探討工業(yè)AI/ML技術的發(fā)展趨勢及相關解決方案

    芯科科技已經(jīng)創(chuàng)建了一套完整的硬件和軟件解決方案,可支持開發(fā)用于工業(yè)市場的工業(yè)AI/ML解決方案。具體來說,我們的Sub-GHz、藍牙和802.15.4產(chǎn)品內(nèi)置了硬件加速功能,可優(yōu)化邊緣的AI/
    的頭像 發(fā)表于 01-29 09:42 ?452次閱讀

    OpenHarmony社區(qū)運營報告202312月)

    發(fā)展新征程。 ? 2023 12 月 11 日,由 OpenHarmony 項目群技術指導委員會和北京航空航天大學共同舉辦的“OpenHarmony 軟件工程研討會暨北京航空航天
    發(fā)表于 01-10 15:44

    2023獎杯收到

    今天非常高興收到了論壇發(fā)送的2023“年度優(yōu)秀版主”獎杯,今年不知不覺間就將結(jié)束,期待即將到來的2024。加油論壇,加油各位壇友!
    發(fā)表于 12-09 22:26

    【社區(qū)人物】2023度電子發(fā)燒友社區(qū)獲獎名單公布

    。 電子發(fā)燒友一直高度關注著電子工程師的高質(zhì)量發(fā)展;在AI浪潮之下、在各行各業(yè)內(nèi)卷越加嚴重的現(xiàn)狀下,電子工程師群體要怎么破局?此次華秋電子2023
    發(fā)表于 11-24 15:16