近日,最新一期的《自然-人類行為》雜志發(fā)表了一項(xiàng)AI研究成果。該研究顯示,在一組實(shí)驗(yàn)中,兩款A(yù)I大語(yǔ)言模型在某些情境下展現(xiàn)出與人類相似甚至勝過(guò)人類的心理狀態(tài)感知能力。
心理狀態(tài)感知能力,又稱心智理論,對(duì)于人類社交至關(guān)重要。來(lái)自德國(guó)漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的James W. A. Strachan及其團(tuán)隊(duì)設(shè)計(jì)了一系列測(cè)試,以評(píng)估AI模型在發(fā)現(xiàn)錯(cuò)誤觀念、理解間接言辭以及辨識(shí)不敬等多個(gè)維度的表現(xiàn)。
值得注意的是,他們使用了GPT和LLaMA2這兩款模型進(jìn)行實(shí)驗(yàn),并將其與1907名參與者進(jìn)行比較。
實(shí)驗(yàn)結(jié)果表明,GPT在識(shí)別間接請(qǐng)求、錯(cuò)誤觀念和誤導(dǎo)信息時(shí),有時(shí)甚至超過(guò)了人類的平均水平;然而,在辨識(shí)不敬信息方面,LLaMA2優(yōu)于人類,而GPT表現(xiàn)欠佳。
對(duì)此,Strachan解釋說(shuō),LLaMA2的成功可能源于其較低的偏見(jiàn)程度,而非真正對(duì)不敬信息敏感;至于GPT的表現(xiàn)不佳,他認(rèn)為主要原因在于它過(guò)于保守地堅(jiān)持自己的結(jié)論,而非推理出錯(cuò)。
-
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268103 -
模型
+關(guān)注
關(guān)注
1文章
3112瀏覽量
48658 -
GPT
+關(guān)注
關(guān)注
0文章
351瀏覽量
15281
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論