大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

GPT-4一眼看穿論文會不會撤稿:7000篇實測準确率高達95%

2024-04-09 简体 HK SG TW

今天小編分享的科學經驗:GPT-4一眼看穿論文會不會撤稿:7000篇實測準确率高達95%,歡迎閱讀。

把論文丢給 GPT-4 進行撤稿預測,和人類審稿人給出的結果相似性近 95%!

具體來說,來自人大與浙大學者團隊的研究者們把涉及數千篇 SCI/SSCI 的期刊論文的 10000 多條推文喂給了 GPT-4,讓它根據推文回答 " 這篇論文是否有可能被撤稿 ",然後和人類預測的結果相比較。

結果,GPT-4 幾乎完美地勝任了這項工作。

也就是說,雖然近期偶有新聞冒出,有人直接把 ChatGPT 等大模型的生成内容復制進論文正文,進而引發一系列學術不端問題。

但,大模型可能引發學術不端,也有辦法維護科研誠信。

論文作者 Er-Te Zheng 總結道:

AI 能否應用于學術研究,這一問題的關鍵,在于 AI 工具如何被人類所使用。

推文能預測論文撤稿

作為讓 ChatGPT 預測撤稿與否的基礎,研究團隊首先探索了 " 推文本身能否預測撤稿 "。

現實情況中,許多有問題的論文都是在推特等社交平台上被曝光,引發關注,繼而被撤稿——比如前段時間争議不小的用 AI 繪制小鼠插圖的論文。

在探索推文本身能否預測撤稿的過程中,團隊搜集了一組包含 3505 篇撤稿論文的數據集,并采用粗略精确匹配方法獲得的具有相似特征的 3505 篇未撤稿論文。

這些特征包括發表期刊、發表年份、作者數量和推文數量。

上述 7010 篇論文的推文數據通過推特 API 收集,數據内容包括推文發布日期和文本内容。

篩選出在論文撤稿前發布的推文後,研究團隊最終共搜集到 8367 條涉及撤稿論文的英文推文和 6180 條涉及未撤稿論文的英文推文。

研究把推文分為訓練集和測試集。

訓練集用來訓練模型,然後在測試集上驗證人工預測、關鍵詞方法、機器學習模型和 ChatGPT 的預測結果情況。

人工預測結果(研究者根據推文預測論文撤稿情況)是研究使用的主要基準之一,用以衡量模型與人工方法的一致性情況。

人工預測結果顯示,人類若認為推文暗示論文存在問題,則推文涉及的這篇論文有高達約 93% 的幾率會被撤稿(精确率≈ 93%),這說明部分推文的确能夠預測論文撤稿。

不過,像這樣能通過推文被人工預測出撤稿的論文的總體占比不高,約占所有撤稿論文的 16%(召回率≈ 16%)。

因此,盡管只有一小部分撤稿論文的相關推文在論文撤稿前含有了可識别的問題信号,但這些信号确實存在。

研究者觀察到,能夠有效預測論文撤稿的批評性推文有兩種類型:

第一種直接突出論文中的錯誤或學術不端行為;

第二種使用批評或諷刺的方式來突出論文的質量存疑。

這些推文能夠促使期刊對論文進行調查,如果調查證實了推文中提到的問題的存在和嚴重性,論文随後可能會被撤稿。

在這種情況下,批評性推文可以作為撤稿論文的催化劑,強調了将其納入研究誠信的早期預警系統的價值。

ChatGPT 預測結果 95% 近似人類

既然發現推文具有預測論文撤稿的潛力,研究進一步探索了關鍵詞方法、機器學習模型和 ChatGPT在根據推文來預測論文撤稿方面的潛力,将各模型的預測結果與人工預測結果進行比較。

研究表明,GPT-4 的總體預測結果(包含撤稿預測和非撤稿預測)與人工預測結果的一致性最高,約 95%。

其次是 GPT-3.5 和 SVM 模型,其一致性超過 80%。

而關鍵詞方法與其他機器學習模型的一致性則在 47%-64% 之間,預測效果一般。

在精确率方面,同樣是 GPT-4 的精确率最高:

GPT-4 預測會撤稿的論文中,近 70% 的在人工預測中同樣會撤稿;而其他模型的預測精确率均遠低于 GPT-4。

上圖進一步顯示了不同模型預測結果與人工預測結果的比較。

關鍵詞方法和三種機器學習模型(LR、RF 和 NB)将大量人工無法判定為撤稿的論文歸為撤稿(過拟合率高)。

相比而言,GPT-4 的預測結果最接近于人工預測的結果:

絕大部分 GPT-4 預測為撤稿的論文,人工預測也為撤稿,絕大部分 GPT-4 預測為非撤稿的論文,人工預測同樣為非撤稿。

有請實例

與其他方法相比,ChatGPT 還有一個重要的優勢——能夠為其預測提供理由,而其他方法則無法詳細解釋其決策。

例如,從樣本論文中可以看出,ChatGPT 對推文有深刻的理解,并能準确提取可能預測論文撤稿的信息,為使用推文評估論文是否存在潛在問題提供了寶貴的幫助。

舉個:

然而,也要注意到 ChatGPT 有時存在 " 幻覺 " 問題。

也就是說,ChatGPT 可能會產生不恰當的輸出,因此在使用時需要謹慎,并考慮到其可能的錯誤預測。

例如:

樣例論文 3 中,相關推文是對這篇論文的評價,暗示該論文指出諾獎得主的某篇論文存在問題。

然而,ChatGPT 将樣例論文 3 誤以為是被撤稿的諾獎得主的相關工作,因此這篇論文可能被撤稿。

此處的分析結果表明,ChatGPT存在一定的邏輯推理謬誤與過度解讀等問題。

因此,ChatGPT 雖然能夠通過推文從一定程度上預測論文撤稿,與人工預測的一致性在各模型中表現最好,但其在當前并非完美,在未來仍有長足的改進空間。

網友對這項研究也挺關注,表示用 ChatGPT 預測論文撤稿,真是從未設想過的道路。

因缺斯汀,我還以為沒有足夠多的數據來支撐這一結論呢!

總體而言,研究揭示了社交媒體讨論作為論文撤稿早期預警的潛力,同時也展示了 ChatGPT 等生成式人工智能在促進科研誠信方面的潛在應用。

研究作者介紹

最後,來認識一下這個研究的作者~

Er-Te Zheng(鄭爾特),人大信息資源管理學院碩士生,由 Zhichao Fang 助理教授指導;本科時,他在浙江大學獲得管理學學士學位,師從 Hui-Zhen Fu 副教授。

他的研究方向涉及計算社會科學、科學學和科學計量。

Hui-Zhen Fu(付慧真),浙大公共管理學院信息資源管理系副教授,北京大學博士。

擔任信息資源管理研究所副所長,荷蘭萊頓大學科學技術研究中心(CWTS)訪問學者。

她的研究方向為交叉科學、科學計量、科研誠信和科研管理,在國際權威刊物發表論文超 40 篇(SCI/SSCI),連續四年(2020-2023)入選愛思唯爾中國高被引學者榜單。

Zhichao Fang(方志超),人大信息資源管理學院助理教授,荷蘭萊頓大學科學與技術研究中心(CWTS)博士,萊頓大學 CWTS 客座研究員,伊朗波斯灣大學社交媒體數據研究組成員。

他的研究方向為科學學、科學計量和社交媒體計量學,在科學計量學與科技政策等領網域發表 SCI/SSCI 論文 20 篇。

論文鏈接:https://arxiv.org/abs/2403.16851

—  完  —

【 火熱報名中】中國 AIGC 產業峰會

定檔 4 月 17 日

峰會已經邀請到數位代表技術、產品、投資、用戶等領網域嘉賓,共論生成式 AI 產業最新變革趨勢。

最新确認嘉賓包括:商湯科技楊帆、輕松集團高玉石、印象筆記唐毅、螞蟻集團李建國等,。

峰會将全程線上下同步直播,歡迎預約直播 ⬇️

點這裡關注我,記得标星噢

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們