大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

頂流Mamba竟遭ICLR拒稿,學者集體破防變,LeCun都看不下去了

2024-01-27 简体 HK SG TW

今天小編分享的科學經驗:頂流Mamba竟遭ICLR拒稿,學者集體破防變,LeCun都看不下去了,歡迎閲讀。

一項ICLR 拒稿結果讓 AI 研究者集體破防,紛紛刷起小醜符号。

争議論文為 Transformer 架構挑戰者Mamba,開創了大模型的一個新流派。發布兩個月不到,後續研究 MoE 版本、多模态版本等都已跟上。‍‍

但面對 ICRL 給出的結果,康奈爾副教授 Alexander Rush 都表示看不懂怎麼回事了," 如果這都被拒了,那我們小醜們還有什麼機會 "。‍

在評論區和轉發區,不少研究者帶上小醜面具前來報道。

具體來説,四位審稿人打出8/8/6/3的分數,這樣被拒很多人就已經覺得不正常。

其中一位審稿人提的問題是" 有沒有訓練更大的模型,和 10b 參數的 Transformer 比較如何?"。

對此,有人表示已經開始向審稿人提及實驗成本了。

審稿人可能不知道他們要求的實驗會花費50000 美元。

ICLR 會議創辦的初衷正是優化同行評審過程,LeCun作為會議創始人之一,也表達了不滿:

很遺憾,歷屆程式委員會主席慢慢把它變成了一個與傳統評審流程差不多的會議。

只有一些小勝利:OpenReview 平台現在被大多數 ML/AI 會議使用,以及論文提交後立刻就能被所有人閲讀(盡管匿名)。

LeCun 還舉例自己也有一篇從未被接受、ArXiv 獨占的論文,現在被引用次數已超過 1880 次。

也有研究者認為,這次很多高分被接受論文與 Mamba 比起來充其量只能算增量研究,更令人遺憾了。

這屆 ICLR 混亂重重

先來借用給 6 分審稿人的意見,簡單介紹一下 Mamba 論文的主要貢獻。

提出了基于SSM 狀态空間模型的新架構,可實現 Transformer 質量的性能,同時線性縮放序列長度。

提出了一種硬體感知算法,通過掃描而不是卷積來循環計算模型,避免具體化擴展狀态以減少内存使用。

将先前的深度序列模型架構簡化為同構架構,具有快速推理、線性縮放和改進的長序列性能。

在多種模态(語言、音頻和基因組學)上都取得 SOTA 性能,成為跨模态通用序列模型主幹的有力候選者。

但這位審稿人提出的二次内存需求問題,不少熟悉這篇論文的人都表示不認可。

對此,作者也在 Rebuttal 中給出了解釋,内存需求實際上是随序列長度線性增長的。

另外一位打 3 分的審稿人,還被吃瓜群眾指出可能根本不熟悉什麼是 RNN。

作者針對這位審稿人的 Rebuttal 太長,足足分了 4 條才發完。

然鵝,這位對自己評分給出 5 級置信度的審稿人,根本沒有回復。

這就讓人更擔心會不會影響領網域主席的判斷了。

正如這位研究者所説,這屆 ICLR 出現的争議還不止一例。

8/8/6/3 如果被拒還算事出有因,知乎相關讨論上還有得分 8/8/8 被 AC 拒,就更離譜了。

還有作者和審稿人吵起來,以至于要讨論禮貌問題的。

投稿接不接收全靠随機?

這也引發了網友們對整體學術評審現狀的讨論。其中一個主要讨論點是評審過程有缺陷 " 接不接受真的很随機,和論文本身的質量關系不大 ":

網友也是緩緩打出一個問号:

既然評審流程存在問題,那解決方案是什麼?就靠運氣?

對此,康奈爾副教授 Alexander Rush 甚至還提出了這樣的建議 ( 手動狗頭 ) :

如果你讀博已經讀到了第六年的那種,應該提交兩篇糟糕的論文,而不是一篇好的。

不只一位學者分享了類似的建議:

我的教授曾説,論文被接受的過程就像擲一個四面骰子,如果這次運氣不好,就再擲一次……

當然,也有人抱有不同的觀點,認為會議作為一種認可,已出名的作品其實已經不需要了,可以給其他未被發掘的論文更多機會,所以已經出名的論文被學術會議拒絕也是完全可以接受的。

值得一提的是,還有不少人建議大家轉投新生代會議CoLM,Alexander Rush 自己也參與了這個會議的創辦:

而大家提到的 CoLM 會議,全稱 Conference On Language Modeling,專注于語言模型領網域。CoLM 剛創立不久,第一屆大會将在今年 10 月份舉辦。

其中七位組織者均是來自業界學界的大佬,其中有三位是華人學者谷歌周登勇、普林斯頓陳丹琦、Meta 的 Angela Fan。

與 ICLR 類似,COLM 将采用雙盲審核,并使用 OpenReview 管理投稿。

會議征稿主題包括但不限于語言建模及大模型語境下的對齊、數據、評估、社會影響、安全、科學、高效計算、工程、學習和推理算法等 17 個方向。

據説,COLM 還是在 ACL 2024 主席公開抨擊稱 "arXiv 是科研的毒瘤 " 而後引發争論的背景下,催生出來的。

參考鏈接:

[ 1 ] https://twitter.com/srush_nlp/status/1750526956452577486

[ 2 ] https://x.com/ylecun/status/1750594387141369891

[ 3 ] https://openreview.net/forum?id=AL1fq05o7H

—  完  —

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們