今天小編分享的科技經驗:ICML2023傑出論文大幅減少至6篇,大模型水印技術受青睐,歡迎閲讀。
品玩 7 月 26 日訊,據機器之心報道,由國際機器學習學會舉辦的 ICML 2023 官方今天放出了傑出論文獎獲獎論文。共有六篇論文獲獎:
由 Meta AI、Inria Sierra 發表的《Learning-Rate-Free Learning by D-Adaptation》,這篇論文旨在為非光滑随機凸優化獲取無學習率的最優界限,所提方法克服了優化此類問題時傳統學習率選擇的限制,為優化領網域做出了有價值且實際的貢獻。
由馬裏蘭大學發表的《A Watermark for Large Language Models》,這篇論文提出了一種對大型語言模型的輸出添加水印的方法,通過将信号嵌入到生成的文本中,這些信号對人類來説是不可見的,但可以通過算法檢測到。
由 EPFL、蘋果發表的《Generalization on the Unseen, Logic Reasoning and Degree Curriculum》。論文在布爾函數的學習方面取得了重要進展,尤其是針對未見過網域的泛化(Generalization on the Unseen, GOTU),這是一個具有挑戰性的分布外泛化問題。
由 CREST、ENS Lyon、Omron Sinic X、Deepmind 等機構聯合發表的《Adapting to game trees in zero-sum imperfect information games》,這篇論文介紹了不完全信息零和博弈的近優策略。研究者建立了一個新穎的下界,并提出了兩種算法 — 平衡 FTRL 和自适應 FTRL。這些貢獻極大地推動了不完全信息博弈優化領網域的發展。
由 IQVIA Inc、北卡羅來納州立大學發表的《Self-Repellent Random Walks on General Graphs - Achieving Minimal Sampling Variance via Nonlinear Markov Chains》,這篇論文解決了一組具有挑戰性的開放問題,提出了具有自排斥随機遊走的馬爾可夫鏈蒙特卡洛(MCMC)。給定任何對應目标概率分布的馬爾可夫鏈,這種自排斥随機遊走(SRRW)不太可能過渡到過去高訪問量的節點,而更有可能過渡到很少訪問的節點。
由哥倫比亞大學發表的《Bayesian Design Principles for Frequentist Sequential Learning》,這篇論文探讨了設計 bandit 和其他順序決策策略這一非常普遍的問題。論文提出使用一種稱為算法信息比的新量對任何策略的遺憾進行約束的方法,并推導出優化該約束的方法。該約束比早期類似的信息理論量更為嚴格,而且這些方法在随機性和對抗性的 bandit 設定中都表現出色,實現了全局最優。