原標(biāo)題:借AI“慧眼”鑒別可疑論文圖片
學(xué)術(shù)期刊工作人員正在核查分析蛋白質(zhì)和DNA的可疑圖片。圖片來源:《自然》網(wǎng)站
今年1月,英國分子生物學(xué)家肖爾托·戴維發(fā)表文章,指控美國哈佛大學(xué)醫(yī)學(xué)院附屬丹娜-法伯癌癥研究所科學(xué)家通過修改圖片偽造數(shù)據(jù)。隨后該研究所正式宣布撤回6篇論文,并糾正了另外31篇論文的數(shù)據(jù)。吹哨人戴維聲稱,這些造假論文發(fā)表于1999年至2017年,其中一些論文刊發(fā)于《細(xì)胞》和《科學(xué)》等頂級科學(xué)期刊。戴維使用人工智能(AI)圖片分析軟件和手動檢測發(fā)現(xiàn)了論文中的問題。
《自然》網(wǎng)站在近日的報道中指出,上述事件只是冰山一角,對學(xué)術(shù)論文中出現(xiàn)可疑圖片的指控還有很多。面對學(xué)術(shù)偵探和公眾的審查,學(xué)術(shù)期刊正在積極部署AI工具,以檢測出可疑圖片。
可疑圖片層出不窮
可疑圖片包括在多個圖中使用同樣的數(shù)據(jù),圖片部分或全部重復(fù),以及拼接圖片等。有些可疑圖片是論文作者有意為之,誤導(dǎo)讀者;有些是作者為了讓圖片變得更加美觀而作出些許改變。專家表示,不管基于何種理由,可疑圖片都損害了科學(xué)的完整性和嚴(yán)謹(jǐn)性。
專門關(guān)注學(xué)術(shù)不端和期刊撤稿的學(xué)術(shù)打假網(wǎng)站“撤稿觀察”維護(hù)的數(shù)據(jù)庫列出了51000多份需要撤回、更正的記錄。
美國科學(xué)圖片審查員伊麗莎白·比克及其同事對此開展了量化分析。他們研究了1995年至2014年間發(fā)表的20000多篇論文中的圖片,結(jié)果發(fā)現(xiàn)近4%的論文包含可疑圖片。這項研究還顯示,從2003年開始,論文中圖片重復(fù)出現(xiàn)的現(xiàn)象有上升趨勢,可能是因為數(shù)字?jǐn)z影技術(shù)使修改圖片變得更容易。
比克指出,與幾十年前相比,現(xiàn)在發(fā)表的論文數(shù)量與日俱增,論文中出現(xiàn)圖片的數(shù)量也水漲船高,可疑圖片也會有增無減。美國科學(xué)公共圖書館出版?zhèn)惱韴F(tuán)隊成員蕾妮·霍赫則認(rèn)為,可疑圖片問題的高報告率也可能源于“全球?qū)φ\信問題的認(rèn)識提高,舉報行為增多”。
丹娜-法伯癌癥研究所正在開展后續(xù)調(diào)查,該機(jī)構(gòu)研究誠信官員巴勒特·羅林斯表示,盡快糾正錯誤至關(guān)重要,這是具有強(qiáng)大研究誠信的機(jī)構(gòu)的常見做法。不過,她也補(bǔ)充道,論文中出現(xiàn)圖片重復(fù)或不一致并不能證明作者有意欺騙。
AI或充當(dāng)“火眼金睛”
為減少可疑圖片發(fā)表,包括《細(xì)胞科學(xué)》《公共科學(xué)圖書館·生物學(xué)》《公共科學(xué)圖書館·綜合》在內(nèi)的一些期刊,要求作者除了提交裁剪或處理后的圖片外,還要提交原始圖片。
許多出版機(jī)構(gòu)計劃將ImageTwin、ImaCheck和Proofig等AI工具,納入出版前檢查中。《科學(xué)》雜志宣布使用Proofig篩選所有投稿。該雜志主編霍頓·索普表示,Proofig發(fā)現(xiàn)了一些問題,編輯因此否決了某些論文的發(fā)表,通常作者也對論文中的錯誤被識別出來表示感謝。
《自然》報道稱,即使圖片已經(jīng)被旋轉(zhuǎn)、拉伸、裁剪,或改變了顏色,這些AI系統(tǒng)都可以快速檢測出同一篇論文中的重復(fù)圖片。當(dāng)然,不同系統(tǒng)各有不同優(yōu)勢。
比克解釋稱,Proofig可以發(fā)現(xiàn)哪些圖片是通過剪切或縫合拼接而來;ImageTwin則使用戶能將某篇論文中的圖片與其他論文的大型數(shù)據(jù)集進(jìn)行交叉檢查。而一些出版商也在開發(fā)自己的AI圖片分析軟件。
研究表明,AI工具標(biāo)記的許多錯誤也有點(diǎn)“無辜”。Proofig對2021年和2022年初提交給美國癌癥研究協(xié)會9家期刊的1300多篇論文開展了分析,發(fā)現(xiàn)15%的論文可能存在圖片重復(fù)問題。論文作者的回復(fù)表明,207次圖片重復(fù)中,28%是作者有意為之,例如使用同一張圖片說明多個論點(diǎn);而另外63%是無意的錯誤。
協(xié)同作戰(zhàn)不可或缺
這些科技期刊用戶報告稱,AI系統(tǒng)肯定能更快、更容易發(fā)現(xiàn)某些類型的圖片問題。但比克認(rèn)為,這些AI系統(tǒng)不太擅長發(fā)現(xiàn)更復(fù)雜的操作,比如AI生成的虛假圖片。英國生物學(xué)-生化與分子生物學(xué)類期刊《恩博報告》主編伯恩德·普爾弗也認(rèn)為,這些AI工具有助于檢測出低級別的誠信違規(guī)行為,但更多更嚴(yán)重的問題可能會急劇增加,目前的方法或許很快會過時。
《自然》指出,要想檢測出可疑圖片,在專家團(tuán)隊的專業(yè)素養(yǎng)、技術(shù)工具,以及提高警惕性等方面要協(xié)同發(fā)揮作用。普爾弗表示,隨著圖片處理變得越來越復(fù)雜,查找可疑圖片將變得越來越困難。
那么,從長遠(yuǎn)來看,如何最好地解決圖片濫用問題呢?
比克表示,科學(xué)家需要更多地關(guān)注嚴(yán)謹(jǐn)性和數(shù)據(jù)的可重復(fù)性,對學(xué)術(shù)不端可能帶來的影響和后果要保持敬畏之心。(記者 劉 霞)