今天小編分享的科技經驗:SpaceX天才實習生課餘用AI破解上古卷軸,獲Nature頭版關注,歡迎閱讀。
克雷西 發自 凹非寺
量子位 | 公眾号 QbitAI
Nature 官網頭版,最新刊發的是最新考古成果,轟動全球的成果——
時隔 2000 年,上古卷軸(赫庫蘭尼姆卷軸)的神秘面紗,終于被揭開!
而且,這項研究還是 AI 完成的,背後的背後則是一名年僅 21 歲的天才少年,馬斯克點贊的 SpaceX 實習生。
不同于一般的密碼破解,分析這份卷軸之難,無異于解讀一本 " 無字天書 " ——
因為在公元 79 年,這組卷軸在一次火山爆發中被燒成了碳,1752 年才被挖掘出土。只要稍有不慎,脆弱的卷軸就會分分鍾變成殘片,想要通過物理方式展開,難如登天。
直到今時今日,三名大學生,終于借助 AI 的力量,成功破譯了其中的段落,打開了全新的考古研究範式。
他們通過給卷軸拍攝 CT 影像并借助機器學習技術分割識别,把卷軸中的 2000 餘個字元,揭示開來。
這一消息也迅速引發了全球轟動,目前為止,浏覽量已經超過了 1500 萬次,轉評贊接近 6 萬。
馬斯克也給三人團隊點了贊,表示這實在是泰褲辣。
DeepMind 的創始人 Demis 也大為贊嘆,還表示自己已經迫不及待地想要讀一讀這段神秘的文字了。
那麼,這份神秘的卷軸是如何一步步被破譯的呢?
不用打開,也能破譯内容
交出這份成果的,是三名學生組成的隊伍,他們分别是:
Youssef Nader,來自埃及,在德國柏林的一家院校攻讀博士
Luke Farritor,SpaceX 實習生,在内布拉斯加大學林肯分校計算機專業讀本科
Julian Schilliger,瑞士蘇黎世聯邦理工學院機器人專業碩士
想要在沒有損傷的前提下破譯這團被燒成碳的卷軸,打開看幾乎是不可能的。
1865 年,有人嘗試用物理方式把卷軸打開,結果以失敗告終,一部分卷軸直接成為了碎片。
此後近兩百年,便再也沒有人敢嘗試物理展開了。
直到 2019 年,肯塔基大學 EduceLab 的 Brent Seales 教授通過粒子加速器給卷軸拍攝了分辨率高達 4μm 的三維 CT 影像。
Seales 教授的博士生 Stephen Parsons 長期致力于使用機器學習模型檢測 CT 影像中的墨水,他利用已經展開的部分帶有可見墨水的卷軸碎片,建立了一個 ground-truth 數據集。
網友們對此事展開了熱烈讨論,并通過一場播客中傳到了 Luke 的耳朵。
這引起了他極大興趣,開始利用空餘時間訓練機器學習模型,以便對墨迹進行分析。
最終,Luke 的模型成功分析出了卷軸中肉眼不可見的符号,并發現了一個完整的單詞。
這個詞是希臘語的 "ΠΟΡΦΥΡΑ Ϲ "(小寫:πορφυ ̣ ρ ̣ ας ̣,拉丁轉寫:porphyras),意思與 " 紫色 " 相關。
這一發現,讓他成為歷史上第一個從赫庫蘭尼姆古卷内部讀出整個單詞的人。
Youssef 是第二個破譯出這個單詞的人,他采用了不同的方法,但得到了内容相同且更為清晰的結果。
也正是看到 Youssef 提交的結果之後,專家們對 Luke 的發現,更加确認了。
Julian 則參與研發了 EduceLab 的 3D 模型分割工具 Volume Cartographer。
Volume Cartographer 将三維 CT 影像沿卷軸展開,并映射到了二維平面,為 Luke 和 Youssef 的破譯工作奠定了基礎。
此後,Julian 又提出了新的分割方法 ThaumatoAnakalyptor,通過重新分割的方式對已破解區網域進行了驗證,并探索了更多未知片段。
此後,為了更快破譯出更多内容,三人組成了超級團隊,最終成功解讀出了 2000 多個字元。
他們使用了三種不同模型架構進行了分析,之間的結果可以相互印證,墨水檢測程式代碼還直接在 GitHub 上做了開源。
他們分析出的這兩千多個字元,位于其中一卷的結尾,篇幅大約是該卷的 5%,内容被認為與伊壁鸠魯哲學有關。伊壁鸠魯(Epicurus)是古希臘哲學家,主要關注個人的幸福和心靈的平靜,但講理性、在自然科學領網域提出了原子論,對後世的倫理學和心理學發展都產生了重要影響。
而在這個卷軸的兩個連續片段中,作者提及了商品(例如食物)的可獲得性(availability)是否以及如何影響它們能帶來的快樂(pleasure)。
所以這次考古發現,實際上或許能進一步幫助了解古人對于世界的認知和探究。
一場挑戰賽,三名學生,500 萬獎金
而讓這三名學生走到一起的,是一場名為 " 維蘇威火山 " 的挑戰賽。
在 Stephen 建立了數據集之後,矽谷企業家、GitHub 前 CEONat Friedman 對此產生了濃厚興趣,并出資贊助了這場比賽。
主辦方于去年 3 月公布了評選标準,參賽者需要破譯至少 4 個段落,每個段落 140 個字元,其中至少 85% 的字元可恢復。
當時,專家組普遍認為一年之内有人挑戰成功的概率還不到三成,但結果卻出乎意料——
據介紹,比賽的消息發布後他們收到了許多作品,直到 ddl 之前幾分鍾還有團隊交出成果。
經過為期一個月的審查,這份包含了 2000 個字元的文本,被認定破譯成功。
這三位獲獎者将瓜分 70 萬美元的獎金,折合人民币 500 多萬。
此外,還有三個團隊因提交的結果具有顯著可讀性,獲得了二等獎,這三個團隊将各獲得 5 萬美元的獎勵。
其中就包括谷歌華人工程師 Shao-Qian Mah 所帶領的團隊。
下一步,比賽主辦方希望在一年的時間内破譯四組卷軸的 90%,後續比賽信息也将在 3 月份公布。
當然,這樣的挑戰賽獎金只是一方面,更重要的是展現了如何用 AI 解決各行各業挑戰的可能性和可行性,包括考古這樣的學科。
或許你也有所耳聞,更早之前,AI 對于甲骨文的研究也開始了。你要還知道其他的項目?也歡迎分享分享~~