今天小編分享的科學經驗:Nature:谷歌學術正在被AI工具颠覆,歡迎閱讀。
曾經每天都用谷歌學術的科學家們,正在轉向新的 AI 工具。
就在谷歌學術迎來 20 歲生日之際,Nature 卻擔憂發文:
谷歌學術能否在人工智能變革中活下來?
沒錯,每月訪問量超過1 億次的谷歌學術,正在被 AI 工具悄然颠覆。
2015 年,艾倫 AI 研究所推出了 Semantic Scholar;
2022 年,OurResearch 推出 OpenAlex;
近來又推出了 consensus、Emergent Mind 等科研 AI 助手;
……
來自華盛頓大學的計算社會科學家 Jevin West 表示,即使自己每天都在用谷歌學術,但是:
鑑于一些新的 AI 工具的到來,現在,也許是谷歌學術作為主要搜索引擎被推翻的時刻。
Nature:谷歌學術正在被 AI 工具颠覆
可以看到,幾個流行的 AI 工具正在實現科學家們眼中," 我們希望谷歌學術去做的事情 "。
稍遠的有,2015 年艾倫 AI 研究所推出了Semantic Scholar,以及 2022 年 OurResearch 推出了OpenAlex。
前者提供了谷歌學術沒有的相關論文推薦和 AI 問答等額外功能,收錄超2 億篇出版品。
後者則是将 4500 萬篇科學論文數據庫與 800 億參數 LLM(大語言模型)結合,打造出一個在事實性與引用準确性方面超越 GPT-4o 的新物種。
為了具體說明 AI 學術工具當前的形态,我們挑幾個來詳細瞅瞅。
Consensus,一款專為科研設計的學術搜索引擎,兩位創始人是西北大學校友兼足球隊隊友。
這個產品利用 LLM 和向量搜索的方式提取 Semantic Scholar 中 2 億多篇同行評審論文,提供更精準的搜索結果。
首頁是醬紫的,看上去還挺簡潔:
話不多說,我們直接拿經典論文《Attention Is All You Need》打個樣:
初步印象,Consensus免登錄可用這一點還挺方便,在搜索結果中,它從上到下展示了論文摘要、關鍵洞察(Key Insights)、結論、以及相關問題等。
一番點點點之後,發現了兩個有意思的功能:
其中之一,為了保證引用資料的可靠性,Consensus 看上去下了功夫。它提供了信息來源的多個維度,包括作者背景、發表時期、期刊信譽、被引次數、基金支持和文章内容等。
另外,點擊這個 "Ask this paper",還能一鍵展開論文全篇并提問互動。
提問框會先出現在頁面底部,點進去就是完整論文。
不過需要注意,此時它會提醒,"Ask this paper" 需要登錄後才能使用。
登錄解鎖後,即可針對論文進行提問,也支持中文。
目前,Consensus 的免費版本提供無限搜索和有限 GPT-4 摘要,其高級版本為每月 8.99 美元(大約 65 元人民币)。
和 Consensus 類似,Emergent Mind也是一款專為計算機科學家設計的 AI 研究助手,由獨立開發者 Matt Mazur 創建。
與 ChatGPT 這類通用模型不同,它高度專注于計算機科學這一領網域,能夠搜索和總結最新的計算機科學論文。
丢給它同一篇論文後,結果看起來雀食顯得" 更專業 "。
首先,它會在結果頂部展示論文 pdf,點進去就是原文,非常直給。
然後概述、關鍵貢獻、實驗過程及結論、研究意義等一字排開,能看出基本貼合論文叙述大綱,邏輯一目了然,重點也全摘出來了。
不過遺憾的是,提問這個功能只有Pro 用戶才能解鎖,一般人支不動(doge)。
但但但是,有項功能絕了,回答末尾竟提供了各大社媒的相關評論地址,推特、黑客新聞、油管等全都有。
點擊就能直接跳轉,甚至支持預覽。
而且,論文作者發表了多少論文,也都整理匯總了。
目前,Emergent Mind 允許每天進行5 次免費搜索。
另一個比較有代表性的是Cambrian,專注機器學習領網域,由 Cambrian ML 團隊(謝賽寧和 LeCun 領導)開發。
Cambrian 主要幫助人們快速發現最新的機器學習(ML)研究,收錄了自 2017 年以來超 24 萬篇ML 論文。
還是同一套題:
一個明顯不同是,Cambrian 雖然在第一的位置提供了我們要的原文,但也依次展示了其他相關論文。
換句話說,它一開始就沒有局限于我們指定的論文。
整體來看也很簡潔,甚至還在論文底部提供了查看 pdf、和論文聊天、提問、跳轉開源社區等功能。
論文右下角也直觀展示了引用量,方便篩選相關論文中大家關注更高的。
嘗試了一下和論文聊天,頁面展開後,又發現了兩個小點很有意思。
一個是其他 AI 工具少見的,可直接查看論文大綱。
另一個是筆記功能,選中某一段或某個詞後,既可以要求解釋,也可以做标注,側邊欄還能看到所有标注。
小結一下,目前絕大多數 AI 學術工具主要在兩個方向上發力:
初步搜索頁面的結果展示
與論文進行互動
在大方向基本一致的情況下,各家在一些小細節之處稍有不同。
不過,和我們平時使用的類似國產工具相比,有一個功能貌似都沒看到——全文翻譯。
比如豆包插件,可以同屏左右對照翻譯。
除了上面這類形态,以 Agent(智能體)為代表的 AI 工具也開始冒頭。
比如Undermind,它使用更復雜的基于 Agent 的搜索,雖然比傳統搜索引擎用時更長(幾分鍾),但回答質量更好。
(一開始就要注冊賬号,且需要機構或公司郵箱地址)
一眼看過去,它把參考來源整理的非常清晰詳細,整體也偏向正經科研。
更多類似工具在此不再贅述,我們能夠看到,正如 Nature 所擔憂的——
谷歌學術正在被 AI 工具颠覆。
谷歌學術:即将成立 20 年,每月訪問量上億
誰曾想,成立于 2004 年的谷歌學術,當時也是以 " 颠覆者 " 的姿态闖入文獻檢索領網域。
在它出現之前,研究人員主要靠圖書館或付費數據庫(如 Web of Science 和 Scopus)來檢索學術文獻。不僅繁瑣耗時,而且需要支付費用才能訪問完整的文章。
甚至就在谷歌學術推出的同月,愛思唯爾(Elsevier)還推出了付費服務 Scopus,這是一個包含大量科學參考文獻和摘要的大型數據庫。
面對當時的局面,谷歌學術打出了" 站在巨人的肩膀上 "這一廣告标語。
簡單說,谷歌學術的兩位聯合創始人 Anurag Acharya 和 Alex Verstak(同為谷歌工程師)通過強大的網絡爬蟲技術,抓取了各種形式的學術資料。
比如書籍章節、報告、預印本和網頁文檔,甚至包括非英語的作品,這些資料涵蓋了多個學科領網域,包括自然科學、人文科學和社會科學。
按照 Anurag Acharya 的設想,其目标是:
讓全世界的學者更加高效,幫助每個人都能站在科學共同前沿。
就在當年 11 月,谷歌學術推出了Beta 測試版,主打快速、免費檢索。
後來,他們一路更新打怪,不斷豐富完善谷歌學術的功能。
他們積極争取學術出版商的支持,同意讓谷歌學術索引他們的内容。
一番努力下,全球最大的在線期刊庫 JSTOR 最終同意向用戶提供文章的第一頁掃描,這對用戶來說非常重要,因為他們至少可以看到摘要,從而決定是否需要進一步閱讀整篇文章。
到了中期,随着收錄了大量高質量的學術文獻,團隊将發力點放在了推出新功能上。
例如,他們推出了個人圖書館功能,使用戶可以保存感興趣的文章到個人賬戶中,便于後續查閱和管理。
此外,還推出了引用追蹤功能,用戶可以通過查看某篇文獻被引用的情況來了解其學術影響力和引用趨勢。
直到近期,谷歌學術繼續優化其搜索算法和服務,引入了更多智能化的功能。
總之,經過近 20 年的發展,谷歌學術已經成為 " 最大的、也是最全面的學術搜索引擎 "。
甚至有網友熱烈表白,自己從未使用除了谷歌學術之外的東西。
截止目前,根據網絡流量統計網站 Similarweb 的數據,谷歌學術每月的訪問量超過 1 億次。
而這,主要得益于谷歌學術這些年積攢的自身優勢:
免費訪問,且在搜索結果中傾向于展示文獻免費版本;
資源覆蓋廣;
高級搜索選項;
在沃頓商學院 Ethan Mollick 教授看來,谷歌學術在現代研究中扮演着至關重要的角色。
它是免費的,并且絕對擊敗了其他所有學術搜索引擎,包括專門的搜索引擎。
不過,也是由于谷歌學術的免費性質,人們一直擔心谷歌有天會 " 停辦 "。
對此,一家創業公司的創始人專門寫了篇文章,探讨了谷歌學術背後的商業模式:
谷歌學術實際上可能對谷歌有内部商業價值
照他的觀點,谷歌學術幫助谷歌提供了關于最新研究成果的情報,而且可以通過挖掘其數據庫來尋找潛在員工。
這兩個因素難以轉化為金錢,但在谷歌規模的公司中,長期收益可能每年價值數億美元。
但目前看來,谷歌學術的這些優勢正在被 AI 取代。
Undermind:
https://www.undermind.ai/home/
consensus:
https://consensus.app
Cambrian:
https://www.cambrianml.org/
Semantic Scholar:
https://www.semanticscholar.org/
OpenAlex:
https://openalex.org/
Emergent Mind:
https://www.emergentmind.com/
參考鏈接:
[ 1 ] https://www.nature.com/articles/d41586-024-03746-y
[ 2 ] https://x.com/emollick/status/1587295619449864192
[ 3 ] https://x.com/rohanpaul_ai/status/1858970411658342407