0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高中代寫成風(fēng) 哥本哈根大學(xué)的神操作

Gv1N_smartman16 ? 來源:YXQ ? 2019-06-10 09:13 ? 次閱讀

隨著畢業(yè)季的鄰近,翟天臨又一次被網(wǎng)友們罵上了微博熱搜。

翟的論文抄襲事件過后,許多高校都加強(qiáng)了論文評審標(biāo)準(zhǔn),更有嚴(yán)格的院校連非畢業(yè)生的論文結(jié)課都要查重。

許多深夜改論文的學(xué)生于是結(jié)伴來到微博@翟天臨:你睡了嗎?你怎么睡得著?我還在改論文!你配睡覺嗎!

翟天臨自己可能也沒有想到,竟然陰差陽錯(cuò)對中國高校教育做出了卓越的貢獻(xiàn)。

然而,也有學(xué)渣表示,以后查重這么嚴(yán),抄襲是不可能了,只能找人代寫了。

早有媒體曝光過學(xué)術(shù)圈“論文代寫”的產(chǎn)業(yè)鏈。據(jù)第一財(cái)經(jīng)報(bào)道,相關(guān)淘寶搜索的本科文科論文每千字200元左右。

不過,這條“學(xué)術(shù)歪路”也要被AI堵死了。近日,哥本哈根大學(xué)的研究人員的最新研究稱,剛剛開發(fā)出一款“反槍手代寫”的AI系統(tǒng)。

這款系統(tǒng)意圖通過智能寫作分析技術(shù),來檢測論文作弊??梢愿鶕?jù)你的寫作習(xí)慣,確定論文究竟是你自己寫的作業(yè)還是由他人代寫。

根據(jù)對13萬份書面作業(yè)的分析,科學(xué)家們可以以近90%的準(zhǔn)確率檢測出學(xué)生究竟是自己寫的作業(yè),還是由代筆撰寫。

基本上可以達(dá)到“代寫”作業(yè)一抓一個(gè)準(zhǔn)的結(jié)果了。

高中代寫成風(fēng),哥本哈根大學(xué)的神操作

這套針對學(xué)生論文作弊行為的研究,已經(jīng)在哥本哈根大學(xué)計(jì)算機(jī)科學(xué)系(DIKU)進(jìn)行了幾年了,最初,這款研究是針對丹麥的高中生進(jìn)行的。

在丹麥,高中目前主要使用的作業(yè)查重平臺(tái)叫做Lectio,可以用來檢查學(xué)生的作業(yè)中是否有段落是直接復(fù)制先前提交的作業(yè)的。

然而,隨著各類線上服務(wù)平臺(tái)的盛行,在丹麥高中生中,找人代寫作業(yè)變得越發(fā)容易。

面對這種情況,學(xué)校一直缺乏有效的檢測手段。

學(xué)習(xí)軌跡項(xiàng)目或“SRP”(丹麥語的“Studie Retnings Projekt”)是丹麥高中畢業(yè)生的必修跨學(xué)科課程,也是一項(xiàng)非常重要的書面作業(yè)。在這個(gè)項(xiàng)目中的作弊現(xiàn)象尤其引人注目。

由于SRP對于畢業(yè)十分重要,很多學(xué)生們在丹麥競拍網(wǎng)站Den Bla Avis上發(fā)布他們的寫作任務(wù)來找人代寫。

和中國的老師和大多數(shù)查重系統(tǒng)一樣,Lectio只能查重,沒法判斷一份作業(yè)是否是找人代寫的。

哥本哈根大學(xué)的一些院系一直和很多高中有著SRP項(xiàng)目的合作,深受代寫作弊行為之害,一直在探究解決之道。

這所大學(xué)的計(jì)算機(jī)科學(xué)系DABAI項(xiàng)目組決定教教這些偷懶的高中生們“做人”。

DABAI(丹麥大數(shù)據(jù)分析驅(qū)動(dòng)創(chuàng)新中心)是一個(gè)成立于2016年的丹麥國家研究中心。除了研究機(jī)器學(xué)習(xí)的高效算法,這個(gè)研究小組本來就對學(xué)生教育特別關(guān)注。之前,他們曾研究了“優(yōu)化學(xué)生的個(gè)性化學(xué)習(xí)”、“提高教師洞察力”等教育項(xiàng)目。

名叫“槍手”的反槍手神器

這個(gè)防作弊程序被叫做Ghostwriter(槍手),它本質(zhì)上屬于一種基于機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù)的一款文本分析程序。

項(xiàng)目組成員Stephan Lorenzen博士稱,這款程序可以比較該學(xué)生最近提交和以前提交的文章來識(shí)別寫作風(fēng)格的差異。

“程序會(huì)關(guān)注單詞長度、句子結(jié)構(gòu)以及單詞的使用方式等諸多特征。例如,它會(huì)察覺‘for example’被寫成了‘ex’,還是‘e.g.,’。”

其數(shù)據(jù)集來自為丹麥高中提供Lectio平臺(tái)的MaCom公司,該公司覆蓋了丹麥90%以上的高中,他們?yōu)镚hostWriter項(xiàng)目的研究人員提供了13萬份不同高中學(xué)生書面作業(yè)。

這個(gè)研究組認(rèn)為,這款產(chǎn)品非常具有實(shí)際效用,很多學(xué)校對于找出“論文究竟是誰寫的”這個(gè)問題有著越來越高的技術(shù)需求。

但Stephan Lorenzen博士也認(rèn)為,“在此之前,還需要認(rèn)真討論一下應(yīng)用這項(xiàng)技術(shù)所面臨的倫理問題。我們不能把這個(gè)程序得到的結(jié)論作為判別是否作弊的唯一標(biāo)準(zhǔn),更應(yīng)該把它看作一份輔助性的證據(jù)。”

Ghostwriter是怎么工作的?

Ghostwriter程序使用Siamese 神經(jīng)網(wǎng)絡(luò)來區(qū)分不同文本的寫作風(fēng)格:通過大量數(shù)據(jù)的訓(xùn)練,學(xué)習(xí)不同寫作風(fēng)格的外在表現(xiàn)(representation),然后進(jìn)行比對。

這個(gè)項(xiàng)目分兩步來解決作者身份驗(yàn)證問題。首先是解決了計(jì)算兩個(gè)文本之間寫作風(fēng)格相似性的問題,主要通過使用Siamese網(wǎng)絡(luò)學(xué)習(xí)相似度函數(shù)s:T×T→[0,1]。其次是再解決作者A的驗(yàn)證問題,通過比對未知作者文本X和已知是作者A的文本T之間的相似性。

網(wǎng)絡(luò)方面,他們考慮使用不同的輸入通道考慮幾種不同的體系結(jié)構(gòu)(例如,char,word,POS-tags),最終確定了一種表現(xiàn)最佳的網(wǎng)絡(luò)架構(gòu):

Best performing network

編碼部分包括一個(gè)字符嵌入(Embd),然后是兩個(gè)不用的卷積層,每個(gè)卷積層后面都有一個(gè)全局最大池化層(GMP)。

在比較部分,他們首先計(jì)算合并層中的編碼之間的絕對差值,然后,應(yīng)用4個(gè)密集層,每層有500個(gè)神經(jīng)元,最后使用具有兩個(gè)輸出的softmax層來進(jìn)行歸一化。

他們將數(shù)據(jù)集分為三份,T-train用于訓(xùn)練,T-val用于訓(xùn)練提前停止和selecting Cs,T-test僅用于估測試模型。

經(jīng)過訓(xùn)練,模型的準(zhǔn)確率達(dá)到了87.5%。

最后實(shí)現(xiàn)的功能就是,當(dāng)學(xué)生提交作業(yè)時(shí),該網(wǎng)絡(luò)會(huì)將其與以前的作業(yè)進(jìn)行比較。對于每個(gè)作業(yè),神經(jīng)網(wǎng)絡(luò)都會(huì)計(jì)算出一個(gè)百分?jǐn)?shù),用于表示新舊作業(yè)的相似性。然后,通過綜合考慮新舊作業(yè)相似性、交作業(yè)時(shí)間等多種因素計(jì)算出一個(gè)加權(quán)平均值。這個(gè)最終值就可以用來表示新作業(yè)和學(xué)生寫作風(fēng)格之間的相似性。

這一研究已經(jīng)被發(fā)表在一篇名為《識(shí)別高中代寫“槍手”》的論文中。

除了論文,還能與警方合作篩查偽造文本

除了代寫作業(yè),Ghostwriter的技術(shù)也可以應(yīng)用于社會(huì)的其他地方。

例如,該程序可輔助警方的文檔審查員執(zhí)行各類文件的真?zhèn)畏治鋈蝿?wù),比如一份商業(yè)合同是否是偽造的;或者一個(gè)離奇的自殺案中,死者留下了一封遺書,這封遺書是不是死者本人寫的等等。

“與警方合作將是一件有趣的事情。警方現(xiàn)有的方法是聘用文件審查員來定性的比較文本之間的相似性和差異。而我們的方法則適用于大數(shù)據(jù)并自動(dòng)找到其中潛藏的模式。我認(rèn)為結(jié)合兩者將有利于警察開展工作?!盠orenzen說,他強(qiáng)調(diào)這里也同樣需要討論其面臨的倫理問題。

這項(xiàng)利用人工智能來檢測作業(yè)中作弊行為的技術(shù),具有廣泛的應(yīng)用前景。

目前,它還被用來分析Twitter文本,以確定文本內(nèi)容是由真實(shí)用戶撰寫的,還是由水軍或機(jī)器人編寫的。也就是說,淘寶店鋪雇傭水軍好評,很有可能也能被識(shí)別出來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266254
  • Twitter
    +關(guān)注

    關(guān)注

    0

    文章

    176

    瀏覽量

    15775

原文標(biāo)題:“翟天臨”克星?新開發(fā)的反“槍手”AI,識(shí)別作業(yè)代寫準(zhǔn)確率接近90%

文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    成風(fēng)扇控制的LM96000硬件監(jiān)視器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《集成風(fēng)扇控制的LM96000硬件監(jiān)視器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-14 11:11 ?0次下載
    集<b class='flag-5'>成風(fēng)</b>扇控制的LM96000硬件監(jiān)視器數(shù)據(jù)表

    具有集成風(fēng)扇控制的LM93硬件監(jiān)視器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《具有集成風(fēng)扇控制的LM93硬件監(jiān)視器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-14 10:44 ?0次下載
    具有集<b class='flag-5'>成風(fēng)</b>扇控制的LM93硬件監(jiān)視器數(shù)據(jù)表

    LM96063帶集成風(fēng)扇控制的遠(yuǎn)程二極管數(shù)字溫度傳感器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《LM96063帶集成風(fēng)扇控制的遠(yuǎn)程二極管數(shù)字溫度傳感器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-12 09:49 ?0次下載
    LM96063帶集<b class='flag-5'>成風(fēng)</b>扇控制的遠(yuǎn)程二極管數(shù)字溫度傳感器數(shù)據(jù)表

    智力搶答器電路設(shè)計(jì)(八路)74LS148 74LS279 CD4511怎么接電路板

    高中沒學(xué)過大學(xué)學(xué)起來很吃力
    發(fā)表于 06-25 09:38

    J-FLASH在燒寫時(shí)會(huì)將沒有數(shù)據(jù)的空白地址段寫成0x00,是否可以修改J-FLASH配置文件將數(shù)據(jù)寫成0xFF?

    J-FLASH在燒寫時(shí),會(huì)將沒有數(shù)據(jù)的空白地址段寫成0x00,是否可以修改J-FLASH配置文件將數(shù)據(jù)寫成0xFF? 是否有大神知道怎么辦?
    發(fā)表于 04-19 08:12

    CYUS3014 RAM燒寫成功,為什么枚舉不起來?

    CYUSB3014 RAM顯示燒寫成功后,缺不再枚舉,技術(shù)支持讓我更換芯片后,問題依舊,請問是否還有別的方式可以查找問題?
    發(fā)表于 02-29 07:13

    CYUSB3014-BZXI RAM燒寫成功后PC無法識(shí)別設(shè)備的原因?怎么解決?

    我設(shè)計(jì)了一個(gè)CYUSB3014的實(shí)驗(yàn)板,連接電腦后controlcenter可以顯示BootLoader,燒寫代碼到RAM中,顯示燒寫成功,但是并沒有重枚舉。也就是說電腦沒有任何反應(yīng),包括識(shí)別USB
    發(fā)表于 02-29 06:02

    Hightec對芯片中斷優(yōu)先級分配時(shí),中斷號越高中斷優(yōu)先級越高嗎?

    請問大佬,Hightec對芯片中斷優(yōu)先級分配時(shí),中斷號越高中斷優(yōu)先級越高嗎?看網(wǎng)上的帖子說中斷號越低優(yōu)先級越高。
    發(fā)表于 02-27 06:13

    淺談flash存儲(chǔ)器的特點(diǎn)和優(yōu)缺點(diǎn)

    Flash存儲(chǔ)器的寫操作具有特殊性,它只能將數(shù)據(jù)位從1寫成0,而不能從0寫成1。因此,在對存儲(chǔ)器進(jìn)行寫入操作之前,必須先執(zhí)行擦除操作,將預(yù)寫
    的頭像 發(fā)表于 02-19 11:37 ?2199次閱讀
    淺談flash存儲(chǔ)器的特點(diǎn)和優(yōu)缺點(diǎn)

    XMC7200-SPI在cyhal_hw_resources.h中代表什么?

    以下定義在 cyhal_hw_resources.h 中代表什么? CY_IP_MXSCB_INSTANCES CY_IP_MXS22SCB_INSTANCES 另外,有人有 SPI 初始化的示例配置嗎
    發(fā)表于 01-18 08:34

    DAYU200 rk3568板子燒寫OpenHarmony鏡像resource.img誤燒寫成ramdisk.img,燒寫成功后無法開機(jī)無法進(jìn)入loader模式,求助!?。?/a>

    DAYU200 rk3568板子燒寫OpenHarmony鏡像resource.img誤燒寫成ramdisk.img,燒寫成功后無法開機(jī)無法進(jìn)入loader模式,求助?。?! RT,有沒有同仁遇到類似問題或者有解決方案的,求拯救。
    發(fā)表于 12-15 22:24

    SiC FET應(yīng)用,在各種領(lǐng)域提高功率轉(zhuǎn)換效率

    SiC FET應(yīng)用,在各種領(lǐng)域提高功率轉(zhuǎn)換效率
    的頭像 發(fā)表于 11-30 09:46 ?344次閱讀
    SiC FET<b class='flag-5'>神</b>應(yīng)用,在各種領(lǐng)域提高功率轉(zhuǎn)換效率

    一項(xiàng)新研究有望解決超靈敏量子傳感器開發(fā)中的關(guān)鍵障礙

    哥本哈根大學(xué)尼爾斯-玻爾研究所(NBI)的一項(xiàng)新研究有望解決超靈敏量子傳感器開發(fā)中的關(guān)鍵障礙。 實(shí)驗(yàn)設(shè)置示意圖 量子傳感器在監(jiān)測胎兒心跳以及其它精密醫(yī)療檢查方面展示了巨大的潛力。這類傳感器利用了原子
    的頭像 發(fā)表于 11-11 09:03 ?677次閱讀
    一項(xiàng)新研究有望解決超靈敏量子傳感器開發(fā)中的關(guān)鍵障礙

    “連下三城” 寧德時(shí)代行電池裝車提速

    自寧德時(shí)代發(fā)布“行電池”以來,多家車企接連宣布了采購并搭載裝車的計(jì)劃。
    的頭像 發(fā)表于 10-19 09:08 ?863次閱讀

    誰知道FatFs中代碼頁存在的意義是什么?

    FatFs中代碼頁存在的意義是什么?
    發(fā)表于 10-16 07:58