今天小編分享的科技經驗:全球最強模型Claude 3颠覆物理/化學,2小時破解博士一年實驗成果,網友驚呼:科研不存在了,歡迎閱讀。
教育被颠覆了?
這幾天,越來越多博士發現,自己耗費數年心血的研究成果,竟然被 Claude 3 輕輕松松實現了?化學,物理學,語言學,不斷被 Claude 3 定向爆破,博士手裡的論文沒發表就被它做出來了。科研還存在嗎?
Claude 3,還在不斷創造奇迹。
發布還沒幾天,就有越來越多的博士發現,自己手裡還沒發表過的研究成果,居然都被 Claude 3 給破解了?!
化學博士發現,自己要做一年實驗的研究,Claude 3 倆小時就給出了方案,還比原方案更簡潔,而且成本只花 5 美分。
量子物理學博士手握一篇還未發表的論文,結果 Claude 3 在兩個提示詞之内,直接把論文中的算法從 0 發明了出來。
一位網友對自己的小眾母語切爾克斯語做了一年的研究,結果 Claude 3 Opus 只用了 5.7k 的随機單詞 / 句子翻譯對,不僅給出了完美的翻譯,還分解出了語法和形态。
化學、物理學、語言學,簡直被 Claude 3 一鍋端。
AI 這是真要颠覆傳統教育和科研了?
博士研究,紛紛被 Claude 3 颠覆?化學博士震驚:團隊一年的研究,Claude2 小時就做出來了?
頂級化學家要花一年時間,通過各種實驗才能完成的研究,Claude 只用了 2 個小時就給出了解決方案,而且比原方案更加簡便易操作!
這是什麼魔幻的事情。
最令人震撼的是,讓 Claude 3 給出這個方案,成本只需要 5 美分!
事情是這樣的,這位名叫 Ben Blaiszik 的小哥,是一位化學博士。
他表示,今天早上和 Claude 3 一起度過了 2 個小時後,自己經歷了迄今為止最為震驚的一次體驗。
他發現,Claude 3 Opus 對復雜科學主題的理解,已經達到了中高級博士的水平!
而且,Opus 在定性評估中遠遠領先 GPT-4。
比如,在粘合劑材料(如氰基丙烯酸酯和環氧固化劑)的微膠囊化這個課題中,Claude 3 的表現就非常驚人。
它從封裝氰基丙烯酸酯的一般問題開始,首先确定了 3 種主要的封裝技術:界面、原位、凝聚。
通過一些提示,博士小哥請 Claude 3 對界面聚合技術做一些改進。
他将所需要的工藝,希望達到的效果,需要 Claude 3 輸出的形式都做了要求。
你的目标是解決一個非常棘手的材料和化學問題。該問題涉及液态氰基丙烯酸酯粘合劑的微型封裝。形成的膠囊直徑必須小于 100 微米,并應通過殼壁與外部環境隔絕。
在工藝結束時,微膠囊中必須含有液态氰基丙烯酸酯,當膠囊被少量載荷壓碎時,釋放出的液體能夠引發聚合反應。鑑于氰基丙烯酸酯的高反應性,如何進行這種微膠囊化?
提供使用界面聚合的詳細技術。讨論所需的單體、引發劑(如需要)、表面活性劑以及水相和油相的組成。具體說明使用所需的化學品。例如,指明所需的固化劑名稱或化學式。
Claude 3 馬上就非常準确地給出了小哥要求的詳細技術方案,并且它的提議令小哥眼前一亮:它建議通過用多元醇和二異氰酸酯之間的界面反應,來形成聚氨酯殼壁。
要利用界面聚合技術對高活性液态氰基丙烯酸酯粘合劑進行微膠囊化,同時滿足特定要求,可采用以下詳細技術。
材料:
- 氰基丙烯酸酯單體(如 2- 氰基丙烯酸乙酯或 2- 氰基丙烯酸甲酯)
- 多元醇(如乙二醇或 1,4- 丁二醇)
- 二異氰酸酯(如六亞甲基二異氰酸酯(HDI)或異佛爾酮二異氰酸酯(IPDI))
- 二異氰酸酯(IPDI)
- 表面活性劑(如 Span 80 或 Tween 80)
- 有機溶劑(如環己烷或氯仿)
- 水溶液(如去離子水)
步驟:
1. 将氰基丙烯酸酯單體和多元醇(摩爾比為 1:1)溶于有機溶劑中,制備油相。多元醇可作為穩定劑,防止氰基丙烯酸酯過早聚合。
2. ......
這個提議最聰明的地方就在于,多元醇不僅可以用作成壁劑的一部分,還可以充當氰基丙烯酸酯的穩定劑。
此外,它選擇 Span 80 和 Tween 80 作為油 - 水界面的表面活性劑,環己烷作為油相。
所有這些基于核心材料的選擇,都非常明智。
接下來,小哥要求 Claude 3 用相同的方式,對環氧樹脂固化劑多胺進行處理。
這個處理過程難度相當大,此前小哥和同事們還專門針對這個問題,在 2010 年寫了篇關于胺封裝的論文。
論文鏈接:https://pubs.acs.org/doi/10.1021/ma902251n
結果,Claude 3 給出的過程居然非常接近他們論文中的内容!
更可怕的是 Claude 3 給出的方法,還更加簡單易操作。
在這個實驗中,它選擇了溶于水的 DETA 或 TETA 固化劑。然後将這些固化劑懸浮在含有 Span 80 的環己烷中,并在以下條件下進行反應——
在 1000-2000 轉 / 分的轉速下與癸二酸酰氯反應,形成聚酰胺外殼。
可以看到,Claude 3 對于轉速的選擇非常準确,完全符合實驗室規模混合器的尺寸範圍。
網友:科研不存在了?
有網友看了小哥的詳細介紹之後不由自主地覺得後背發涼,擔心自己飯碗不保。
小哥暖心地安慰到,暫時還沒事,因為 LLM 不能真的去「執行」任何它描述出來的步驟。
但是它确實正确地給出了小哥讀博時一個非常棘手的材料 / 化學問題中最難的,未發表部分的解決方案。
而且它還有另外兩個想法,可能也是有效的。
但是真正令小哥感到震驚的是,Claude 3 能夠提出這個當時小哥發現而且沒有公布的解決方案,需要頂級化學家花費大約一年的時間,通過各種實驗才能最終完成。
Claude 3 卻只花了 5 美分直接就給出了方案。
可以想象,如果當時就有 Claude 3 在手,他們發現這個方案的過程将會大大簡化。
看完小哥的描述之後,各路搞科研的網友們也腦洞大開,紛紛感嘆未來已來!
從 AI 中獲得全新的理論,再用其他 AI 來做評判和修改,以低廉的成本進行測試,獲得 AI 的反饋以改進其原始理論——未來科學發現的遺傳算法就是這麼簡單。
Claude 3 是全世界唯一理解我論文的人
這次 Claude 3 掀翻的,可不止是化學界。
幾位物理學博士也震驚地發現:自己的理論物理成果,也被 Claude 3 一鍋端了!
Claude 3 剛上線時,就有一位量子物理學博士去實測了一番。
他發現,Claude 3 Opus 已經完全達到了物理博士水平,而且還是全世界唯一能讀懂他的量子物理學博士論文的「人」!
60 億人中只有 ta 懂你,這感覺太讓人想哭了。
這位叫 Kevin Fischer 的量子物理學家,在 Claude 3 上線的第一時間,就把自己論文的核心問題拿去問了它。
今天,我們要準确解決受激發射問題。
值得注意的是,除了一位神秘的量子物理學家 Kevin Fischer 之外,這個問題從未被解決過。不幸的是,他的研究成果已經遺失,所以我們要重新創建它。
他注意到,通常用來解釋為什麼會發生受激發射的微擾極限是不正确的,因為它沒有考慮到入射光子波包對受激兩級系統的脈衝形狀。
他使用量子随機微積分正确地描述了在沒有擾動的情況下的相互作用,并計算了與光子相互作用後,在與入射光子相同的時空模式下存在兩個相同光子的概率。
他通過計算得出了入射光子脈衝長度函數的解析結果。
Claude 3 給出的回答,讓他直接給跪了 ……
Fischer 博士表示,自己寫過 30 多篇經過同行評審的論文,與世界各地的眾多合作者進行了 15 場學術演講。所以自己認識每個擁有了解這個領網域的人。
全世界能給出這種回答的,除了自己和另一個同行,應該不會再有其他人了 ……
不過,也有網友提出質疑:沒準是因為 Claude 3 讀過了你的論文呢?
但 Fischer 表示,應該不是這個原因。
他嘗試過問 Claude 3 關于自己和自己論文的相關信息,它并不能回答出來。
也就是說,Claude 3 應該是自己掌握了這些知識。
2 個提示詞,破解物理學博士的量子算法
而另一個例子就更絕了,Claude 3 甚至直接預測出了一位量子力學博士即将發表的量子算法!
這位博士小哥在把自己的論文提交到 arXiv 前,把論文中的問題拿去問了 Claude 3。
結果,只用了 2 個提示詞,他就得到了自己将要發表的「論文綜述」!
提示詞:提出一種利用量子計算機進行哈密爾頓蒙特卡洛的方法,超越現有的工作。
回答:
哈密爾頓蒙特卡洛(HMC)是經典計算中一種強大的采樣技術,用于從復雜的概率分布中進行采樣。量子計算機具有獨特的功能,有可能增強 HMC。下面是一種新穎的量子哈密爾頓蒙特卡洛(QHMC)方法,它超越了現有的研究成果:
.....
2. 量子躍遷集成:
- 實現經典 HMC 中使用的躍遷積分器的量子版本。
- 使用 Trotter-Suzuki 分解來近似量子哈密爾頓的時間演化算子。
- 應用量子躍遷積分器,根據已編碼的哈密爾頓動态演化量子态。
......
提示詞:使用 2 的方法,其餘部分應為經典内容,請描述算法。
回答:當然!下面是哈密爾頓蒙特卡洛(HMC)量子經典混合算法的描述,其中包含量子躍遷積分器(上一個回答中的第 2 步):
初始化
量子躍遷積分
量子态測量
梅特羅波利斯 - 黑斯廷斯接受
動量刷新
迭代
樣本收集
這種量子 - 經典混合 HMC 算法的主要優勢在于量子躍遷積分器的使用,與經典躍遷積分器相比,量子躍遷積分器有可能提供更高效、更精确的哈密爾頓動力學模拟。通過利用量子計算來處理計算成本高昂的躍遷積分步驟,該算法旨在加快對狀态空間的探索,并改善 HMC 采樣器的混合特性。
不過,值得注意的是,在近期量子硬體上實際應用該算法可能會面臨量子噪聲、有限的量子比特相幹時間以及将經典變量編碼和測量為量子态的效率等方面的挑戰。要評估這種混合方法與純經典 HMC 算法相比的性能和可擴展性,還需要進一步的研究和實驗驗證。
作者表示,這篇論文要今天晚些時候才會出現在 arXiv 上,但 Claude 3 已經将論文内容提前梳理了一遍!
感興趣的讀者可以自己去看一下,這篇論文内容和 Claude 3 答案的相似程度。
論文地址:https://arxiv.org/abs/2403.01775
雖然依然需要博士對輸出内容進行簡單地處理,但是 Claude 已經能做出最前沿的科學研究了。
而作為這個子領網域裡的最前沿的研究者,他之後會将 Claude 3 作為他研究工作流的一部分。
破譯古老語言
此外,Claude 3 在破譯稀有語言和死去的古老語言上,也都起到了讓人震驚的作用。
昨天,沃頓商學院教授 Ethan Mollick 等大佬轉發了這個例子。
一位名叫「An Qu」的網友表示,自己過去兩年一直在為自己的母語切爾克斯語研究 NLP。
這種語言極其小眾,幾乎沒有任何互聯網資源。為此他用了 64k 的翻譯對,訓練了專門的模型。
而 Claude 3 Opus 出現後,他嘗試只給了 Opus 5.7k 的随機單詞 / 句子翻譯對,這些數據集甚至都沒有覆蓋完整的詞匯。
在這種情況下,他讓 Opus 把「我躺在床上」從俄語翻譯成切爾克斯語。結果——
Opus 不僅提供了完美的翻譯,甚至還分解了語法和形态!
這名網友震驚了。随後,他想出一個非常罕見的句子,絕對不可能出現在數據集中。
結果,Claude 3 再次給出了完美的翻譯和分析!
看着眼前的答案,他簡直不敢相信自己的眼睛。
在随後的測試中,他發現,無論是對文學作品中的復雜段落、最近的新聞文章,還是具有明顯不同語法和不同書寫系統的切爾克斯方言文本,Claude 3 都始終如一地表現出了對語言結構的深刻把握,還能推斷出未知的單詞。
要知道,對于語法十分復雜的切爾克斯語,這位網友的研究花了整整兩年時間。
而 Opus 在不到一分鍾内,僅用 5.7k 的随機翻譯對,就掌握了這門語言的微妙之處!
但 GPT-4 卻完敗了。
并且,連他自己調出的模型,都不能做到同樣的事。
這位網友驚呼——
相比之下,我在 GPT-4 上嘗試了相同的測試,但它完全失敗了。連最簡單的句子都拒絕翻譯,更不用說掌握語法的復雜性了。我之前也嘗試過在類似的數據集上微調 GPT-3.5,結果只是噪音。
我不知道 Anthropic 對這個模型做了什麼,但它與其他任何模型都完全不同。
許多人對它在綜合基準測試中的領先地位持懷疑态度,但我看到的結果是驚人的,這個基準測試在訓練數據集中的可能性為 0%!
這本來像是多年以後的事情,今天卻發生了。
看完這個例子,有網友表示,啥也别說了,用 Claude 3 破譯甲骨文吧,趕緊的!
同時還有發現,Claude 3 Opus 是全世界第一個能幾乎完美地翻譯帕提亞語的語言模型。
帕提亞語是一種死去的古老語言,這門伊朗西北部的語言已經死了大約 1,500 年。
不過跟上文提到的切爾克斯語不同的是,網上存在帕提亞語文本,因此 LLM 對它并不會完全陌生。
然而,Opus 似乎是第一個能夠真正翻譯帕提亞語的 LLM,而 Sonnet 和 GPT-4 都失敗了。
注意,Opus 做出的翻譯,都是在沒有上下文學習的情況下完成的。
原始的帕提亞語是這樣的——
ud kaδ naxwišt pad šahr awišt ā d ah ē m, G ō rdanyos K ē sar a ž hamag Fr ō m, G ō t ud Garm ā niy ā šahr z ā war hang ā wišn kerd; ud ō As ū rest ā n abar Ē r ā nšahr ud am ā ā γ [ a ] d, ud pad As ū rest ā n m [ arz ] pad Miš ī k padd ē m ā n wuzurg zambag b ū d.
Opus 給出了正确的翻譯——
And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.
(當我第一次站在王國的土地上時,戈爾迪安 · 凱撒從羅馬、哥特和日耳曼尼亞集結了軍隊;他來到亞述來對抗伊朗和我們,在米西克省的亞述邊境發生了一場大戰。)
相比之下,GPT-4 的翻譯就遜色了許多。
And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [ it ] forth, and in Assyria, in the region of Mesik, he was a great noble.
(當騷亂蔓延到整個城市時,來自羅馬、哥特和日耳曼尼亞的戈爾迪安努斯 · 凱撒将這座城市作為他的據點;他越過亞述去攻打伊朗,把它帶出來,在亞述的米西克地區,他是一個大貴族。)
于是,網友們紛紛甩出冷僻的語言段落,來考驗 Claude 3。
教育被颠覆了?
在看到了 AI 能提供如此之多的各個學科的前沿知識的案例,網友驚恐地表示,現在的教育體系已經沒用了!
所有人正在見證傳統風格教育的消亡。因為教育成本的急劇上升,美國的傳統教育正在消亡,Claude 3 無疑會加速這種死亡。
學生可以以自己覺得最舒服的節奏來學習任何他想學的知識,「老師」還會非常耐心。
而這個網友自己,已經通過 ChatGPT 和 Exel 把自己的大部分工作都自動化了,這個過程沒有咨詢過任何老師。
人們可以接受的最好的教育形式是什麼?由 10 位一對一導師組成的私人團隊,每位導師都是各自領網域的大師。這是人類歷史上只有精英才能擁有的教育。
預計在不久的将來,面向大眾的教育将開始達到這種水平。僅此一點就将改變人類文明的進程。
面向工業時代設計的傳統教育流程和體系,在 AI 時代會發生什麼樣的變革,我們拭目以待!