0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)引發(fā)對科學(xué)見解的反思簡析

中科院半導(dǎo)體所 ? 來源:悅智網(wǎng) ? 2023-03-03 09:39 ? 次閱讀

數(shù)學(xué)和物理是一對老朋友。長期以來,它們見證了技術(shù)發(fā)展的起落,包括計(jì)算尺、計(jì)算器和Wolfram Alpha等輔助工具。如今,隨著機(jī)器學(xué)習(xí)最新進(jìn)展應(yīng)用于解決數(shù)學(xué)和物理問題,這些進(jìn)展提出了一個(gè)根本性的問題:讓算法學(xué)會我們思考方式有何意義?

為什么要這么做?

“計(jì)算機(jī)非常擅長數(shù)學(xué),指的是它們很擅長解決非常具體的問題?!惫雀柩芯吭旱臋C(jī)器學(xué)習(xí)專家蓋伊?古爾阿里(Guy Gur-Ari)說。計(jì)算機(jī)擅長運(yùn)算,填入數(shù)字并計(jì)算是相對簡單的。但在形式結(jié)構(gòu)之外,計(jì)算機(jī)則舉步維艱。

解決數(shù)學(xué)文字問題或“定量推理”看起來比較棘手,因?yàn)樗枰鼮榉€(wěn)健和嚴(yán)密,而解決許多其他問題也許并不需要。雖然機(jī)器學(xué)習(xí)模型接受訓(xùn)練的數(shù)據(jù)越多,產(chǎn)生的錯(cuò)誤越少,但對于定量推理,改進(jìn)的程度卻很有限。研究人員開始意識到,對于機(jī)器學(xué)習(xí)生成模型在解決語言文字問題時(shí)產(chǎn)生的錯(cuò)誤,需要更有針對性的方法。

2021年,來自加州大學(xué)伯克利分校和OpenAI的兩個(gè)不同團(tuán)隊(duì)分別發(fā)布了MATH和GSM8K兩個(gè)數(shù)據(jù)集,這兩個(gè)數(shù)據(jù)集包含了涉及幾何、代數(shù)和微積分基礎(chǔ)等的數(shù)千個(gè)數(shù)學(xué)問題。“我們就是想要看看,數(shù)據(jù)集是否有問題?!痹?a target="_blank">人工智能安全中心研究MATH的研究員史蒂文?巴薩特(Steven Basart)說。用格式更好的、更大的數(shù)據(jù)集進(jìn)行訓(xùn)練,是否能夠修復(fù)機(jī)器學(xué)習(xí)定量推理的錯(cuò)誤?MATH團(tuán)隊(duì)發(fā)現(xiàn),定量推理對最高級的機(jī)器學(xué)習(xí)語言模型也頗具挑戰(zhàn),其得分不到7%。(人類研究生的得分為40%,而國際數(shù)學(xué)奧林匹克競賽冠軍的得分為90%。)

GSM8K數(shù)據(jù)集則是更簡單的小學(xué)階段問題,受訓(xùn)模型的準(zhǔn)確率達(dá)到了約20%。為了實(shí)現(xiàn)這種準(zhǔn)確率,OpenAI的研究人員使用了兩種技術(shù):精調(diào)和驗(yàn)證。在精調(diào)中,研究人員采用一個(gè)包含不相關(guān)信息的預(yù)訓(xùn)練語言模型,在訓(xùn)練中僅展示相關(guān)信息(數(shù)學(xué)問題);驗(yàn)證則允許模型重新審視其錯(cuò)誤。

當(dāng)時(shí),OpenAI預(yù)測,需要使用100倍的數(shù)據(jù)對模型進(jìn)行訓(xùn)練,才能在GSM8K上達(dá)到80%的準(zhǔn)確率。但2022年6月,谷歌的Minerva宣布,小規(guī)模擴(kuò)大訓(xùn)練即可實(shí)現(xiàn)78%的準(zhǔn)確率。OpenAI的機(jī)器學(xué)習(xí)專家卡爾·科布(Karl Cobbe)說:“這超出我們所有的預(yù)期?!卑退_特表示同意,他說:“這太令人震驚了,我還以為要花很長的時(shí)間?!?br />
Minerva使用了谷歌自己的通路語言模型(PaLM),根據(jù)來自arXiv的科學(xué)論文和其他來源進(jìn)行格式化數(shù)學(xué)精調(diào)。此外,幫助Minerva的還有另外兩個(gè)策略。在“思維鏈提示”中,要求Minerva將較大的問題分解為更容易接受的小問題。該模型還使用多數(shù)投票,而不是僅要它提供一個(gè)答案或?qū)⒁粋€(gè)問題解算100次。在這些結(jié)果中,Minerva選出最常見的答案。

這些新策略帶來了巨大的好處。Minerva在MATH上實(shí)現(xiàn)了高達(dá)50%的準(zhǔn)確率,在GSM8K上的準(zhǔn)確率接近80%。在MMLU上也是這樣,MMLU是一個(gè)包含化學(xué)和生物的STEM普通問題集。對問題略微調(diào)整后隨機(jī)取樣,讓Minerva重新進(jìn)行計(jì)算,其表現(xiàn)也很好,這表明,這個(gè)能力不僅源自記憶。

關(guān)于數(shù)學(xué),Minerva了解哪些、不了解哪些,是很模糊的。這與數(shù)學(xué)家使用的帶有內(nèi)置結(jié)構(gòu)的“證明助手”不同,Minerva和其他語言模型沒有形式結(jié)構(gòu)。它們可能會產(chǎn)生奇怪、混亂的推理,但仍然可得出正確的答案。隨著數(shù)字的增大,語言模型的準(zhǔn)確度會下降,這對于可靠的老式TI-84 Plus計(jì)算器,是絕不會發(fā)生的。

“它到底是聰明?還是不聰明?”科布問。雖然像Minerva一樣的模型也許能夠得出與人類一樣的答案,但其遵循的實(shí)際過程可能完全不相同。另一方面,曾被要求“展示自己的作業(yè)”的學(xué)生都很熟悉“思維鏈提示”。

谷歌研究院的機(jī)器學(xué)習(xí)專家伊桑?戴爾(Ethan Dyer)說:“我認(rèn)為人們有這樣一個(gè)概念,做數(shù)學(xué)的人有某種嚴(yán)格的推理系統(tǒng),在已知和未知之間有明顯的區(qū)別?!钡艘部赡艿贸霾灰恢碌拇鸢?、會犯錯(cuò)誤和未能應(yīng)用核心概念。在機(jī)器學(xué)習(xí)的這一前沿,邊界是模糊的。

像物理學(xué)家一樣思考

粒子物理的數(shù)據(jù)與眾不同。雖然已經(jīng)證實(shí)卷積神經(jīng)網(wǎng)絡(luò)(CNN)對樹木、貓和食物等日常物體圖片的分類非常高效,但它并不適合粒子碰撞。加州大學(xué)圣地亞哥分校的粒子物理學(xué)家哈維爾?杜爾特(Javier Duarte)表示,問題在于來自大型強(qiáng)子對撞機(jī)(LHC)的碰撞數(shù)據(jù)無法作為圖像。

華而不實(shí)地描述LHC碰撞可誤導(dǎo)甚至堵塞整個(gè)探測器。實(shí)際上,在數(shù)百萬個(gè)輸入中只有少量幾個(gè)輸入在記錄信號,就像白屏中有幾個(gè)黑色像素。這導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)中的圖像質(zhì)量很差,但在一個(gè)被稱為圖形神經(jīng)網(wǎng)絡(luò)(GNN)的不同新框架中,效果則很好。

除了格式奇怪以外,還有大量的數(shù)據(jù),大約為每秒約1拍字節(jié),其中只有少量高質(zhì)量數(shù)據(jù)被保存下來。為了更好地篩選數(shù)據(jù),研究人員想要訓(xùn)練更敏銳的算法。杜爾特說,要想提高效率,這種算法要具備驚人的速度,在微秒內(nèi)執(zhí)行。剪裁和量化等機(jī)器學(xué)習(xí)技術(shù)能使算法達(dá)到目標(biāo)。

借助機(jī)器學(xué)習(xí),粒子物理學(xué)家可以從不同的角度觀察數(shù)據(jù)。他們不僅關(guān)注單個(gè)事件,還學(xué)習(xí)和思考碰撞期間發(fā)生的幾十個(gè)其他事件,例如希格斯玻色子衰變?yōu)閮蓚€(gè)光子。雖然任意兩個(gè)事件之間沒有因果關(guān)系,但研究人員現(xiàn)在接受一個(gè)更全面的數(shù)據(jù)視圖,而不僅是單個(gè)事件分析得出的零碎視圖。

更引人注目的是,機(jī)器學(xué)習(xí)還迫使物理學(xué)家重新審視基本概念。麻省理工學(xué)院的理論粒子物理學(xué)家杰西?泰勒(Jesse Thaler)說:“過去,我自己對對稱性的看法不嚴(yán)密,強(qiáng)迫自己教授計(jì)算機(jī)什么是對稱,也是幫助自己理解對稱到底是什么?!睂ΨQ需要參考系,換言之,鏡子中變形的球體圖像到底是否對稱?如果不知道鏡子本身是否變形,就無法知道答案。

粒子物理學(xué)中的機(jī)器學(xué)習(xí)仍然處于早期階段,實(shí)際上,研究人員現(xiàn)在對待相關(guān)技術(shù)就像對待廚房的洗碗池。杜爾特承認(rèn):“它也許不適合粒子物理學(xué)中的每一個(gè)問題?!?br />
在一些粒子物理學(xué)家深入研究機(jī)器學(xué)習(xí)的同時(shí),腦中浮現(xiàn)出一個(gè)令人不安的問題:他們是在研究物理學(xué)還是在研究計(jì)算機(jī)科學(xué)?往往不被視為“真正的物理學(xué)”的編程已經(jīng)存在;類似的擔(dān)憂也在困擾機(jī)器學(xué)習(xí)。有的研究人員擔(dān)心機(jī)器學(xué)習(xí)會遮掩非常復(fù)雜的情況,他們正在構(gòu)建算法,使用人類能夠理解的語言來提供反饋。而算法也許不是唯一負(fù)責(zé)溝通的主體。

泰勒說:“另一方面,我們希望機(jī)器能夠?qū)W習(xí)如何像物理學(xué)家那樣思考。我們也要多學(xué)習(xí)如何像機(jī)器那樣思考。我們需要學(xué)會講對方的語言?!?/p>







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 探測器
    +關(guān)注

    關(guān)注

    14

    文章

    2610

    瀏覽量

    72857
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4749

    瀏覽量

    100435
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7383

    瀏覽量

    87643
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8357

    瀏覽量

    132330
  • GNN
    GNN
    +關(guān)注

    關(guān)注

    1

    文章

    31

    瀏覽量

    6325

原文標(biāo)題:機(jī)器學(xué)習(xí)引發(fā)對科學(xué)見解的反思

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    工業(yè)機(jī)器人集成滑環(huán)特點(diǎn)

    工業(yè)機(jī)器人也是滑環(huán)的重要應(yīng)用領(lǐng)域
    的頭像 發(fā)表于 10-23 15:05 ?226次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    、優(yōu)化等方面的應(yīng)用有了更清晰的認(rèn)識。特別是書中提到的基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的能源管理系統(tǒng),通過實(shí)時(shí)監(jiān)測和分析能源數(shù)據(jù),實(shí)現(xiàn)了能源的高效利用和智能化管理。 其次,第6章通過多個(gè)案例展示了人工智能在能源科學(xué)
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量
    發(fā)表于 10-14 09:12

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1126次閱讀

    巖土工程監(jiān)測中振弦采集儀的布設(shè)方案及實(shí)施步驟

    巖土工程監(jiān)測中振弦采集儀的布設(shè)方案及實(shí)施步驟 巖土工程監(jiān)測中,河北穩(wěn)控科技振弦采集儀是一種常用的地下水位和土層壓縮性監(jiān)測工具。它通過采集振弦的振動(dòng)信號來確定地下水位和土層的壓縮性,為巖土
    的頭像 發(fā)表于 05-06 13:25 ?222次閱讀
    巖土工程監(jiān)測中振弦采集儀的布設(shè)方案及實(shí)施步驟<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    智慧燈桿一鍵告警功能的實(shí)用場景

    智慧路燈桿是一種兼具智能化和多功能的新型物聯(lián)網(wǎng)基礎(chǔ)設(shè)施,通過搭載一鍵告警對講盒,能夠大大豐富安防及報(bào)警求助資源,對提升城市的安全性和管理效能具有重要的作用。本篇就結(jié)合城市中的不同場景,智慧燈桿一鍵告警功能的實(shí)用功能。
    的頭像 發(fā)表于 04-28 16:42 ?327次閱讀
    <b class='flag-5'>簡</b><b class='flag-5'>析</b>智慧燈桿一鍵告警功能的實(shí)用場景

    城市綜合管廊能效管理平臺在火災(zāi)防控與消防設(shè)計(jì)

    城市綜合管廊能效管理平臺在火災(zāi)防控與消防設(shè)計(jì) 張穎姣 安科瑞電氣股份有限公司 上海嘉定 201801 摘要:城市綜合管廊中布置很多管線,將其稱之為地下生命線,雖然沒有大量人員聚集,但是一旦這個(gè)
    的頭像 發(fā)表于 04-11 16:39 ?253次閱讀
    <b class='flag-5'>簡</b><b class='flag-5'>析</b>城市綜合管廊能效管理平臺在火災(zāi)防控與消防設(shè)計(jì)

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    人工智能(Artificial Intelligence,AI)是一門涉及計(jì)算機(jī)、工程、數(shù)學(xué)、哲學(xué)和認(rèn)知科學(xué)等多個(gè)領(lǐng)域的交叉學(xué)科,旨在構(gòu)建智能化計(jì)算機(jī)系統(tǒng),使之能夠自主感知、理解、學(xué)習(xí)和決策。如今
    的頭像 發(fā)表于 04-04 08:41 ?236次閱讀

    電氣火災(zāi)的原因及其對策

    電氣火災(zāi)的原因及其對策 張穎姣 安科瑞電氣股份有限公司?上海嘉定201801 摘要:隨著人們生活水平的提高,電氣已成為日常生活及生產(chǎn)作業(yè)中必不可少的能源。電給人們帶來便利的同時(shí),也存在著一定
    的頭像 發(fā)表于 03-12 10:18 ?462次閱讀
    <b class='flag-5'>簡</b><b class='flag-5'>析</b>電氣火災(zāi)的原因及其對策

    【鴻蒙】OpenHarmony 4.0藍(lán)牙代碼結(jié)構(gòu)

    OpenHarmony 4.0藍(lán)牙代碼結(jié)構(gòu)前言 OpenHarmony 4.0上藍(lán)牙倉和目錄結(jié)構(gòu)進(jìn)行一次較大整改,本文基于4.0以上版本對藍(lán)牙代碼進(jìn)行分析,便于讀者快速了解和學(xué)習(xí)
    的頭像 發(fā)表于 02-26 16:08 ?1433次閱讀
    【鴻蒙】OpenHarmony 4.0藍(lán)牙代碼結(jié)構(gòu)<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    大數(shù)據(jù)技術(shù)下智能充電樁在網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用

    大數(shù)據(jù)技術(shù)下智能充電樁在網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用 張穎姣 安科瑞電氣股份有限公司?上海嘉定 201801 摘要:*近幾年來隨著我國經(jīng)濟(jì)社會的飛速發(fā)展,各方面實(shí)力都有了明顯的提升,尤其是步入21世紀(jì)以來
    的頭像 發(fā)表于 02-26 10:57 ?401次閱讀
    <b class='flag-5'>簡</b><b class='flag-5'>析</b>大數(shù)據(jù)技術(shù)下智能充電樁在網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用

    電動(dòng)汽車充電樁檢測技術(shù)應(yīng)用及分析

    電動(dòng)汽車充電樁檢測技術(shù)應(yīng)用及分析 張穎姣 安科瑞電氣股份有限公司?上海嘉定 201801 摘要:直流和交流充電樁是我國當(dāng)前電動(dòng)汽車充電樁中投運(yùn)數(shù)量多的種類,為了維持正常運(yùn)行和使用,更要對檢測
    的頭像 發(fā)表于 02-26 10:52 ?1302次閱讀
    <b class='flag-5'>簡</b><b class='flag-5'>析</b>電動(dòng)汽車充電樁檢測技術(shù)應(yīng)用及分析

    當(dāng)AI遇見量子計(jì)算,會引發(fā)科學(xué)革命嗎?

    我們可以將其稱為未來計(jì)算的復(fù)仇者聯(lián)盟。將兩個(gè)科技界最熱門的術(shù)語——機(jī)器學(xué)習(xí)和量子計(jì)算機(jī)結(jié)合起來,就形成了量子機(jī)器學(xué)習(xí)(quantum machine learning)。
    的頭像 發(fā)表于 01-05 14:00 ?838次閱讀

    儲能的三大應(yīng)用場景

    儲能的三大應(yīng)用場景-古瑞瓦特 隨著太陽能風(fēng)能發(fā)電比例的不斷增長,可再生能源間歇性和不穩(wěn)定性的缺陷日益突出,不穩(wěn)定的光伏和風(fēng)電對電網(wǎng)的沖擊也日益嚴(yán)重。抽水儲能,壓縮空氣和蓄電池儲能等技術(shù)越來越被
    的頭像 發(fā)表于 12-20 16:30 ?1248次閱讀
    儲能的三大應(yīng)用場景<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    GPT推斷中的批處理(Batching)效應(yīng)

    機(jī)器學(xué)習(xí)模型依賴于批處理(Batching)來提高推斷吞吐量,尤其是對于 ResNet 和 DenseNet 等較小的計(jì)算機(jī)視覺模型。
    的頭像 發(fā)表于 12-18 15:52 ?662次閱讀
    GPT推斷中的批處理(Batching)效應(yīng)<b class='flag-5'>簡</b><b class='flag-5'>析</b>