SpaceX天才實習生課餘用AI破解上古卷軸，獲Nature頭版關注

今天小編分享的科技經驗：SpaceX天才實習生課餘用AI破解上古卷軸，獲Nature頭版關注，歡迎閱讀。

克雷西發自凹非寺

量子位 | 公眾号 QbitAI

Nature 官網頭版，最新刊發的是最新考古成果，轟動全球的成果——

時隔 2000 年，上古卷軸（赫庫蘭尼姆卷軸）的神秘面紗，終于被揭開！

而且，這項研究還是 AI 完成的，背後的背後則是一名年僅 21 歲的天才少年，馬斯克點贊的 SpaceX 實習生。

不同于一般的密碼破解，分析這份卷軸之難，無異于解讀一本 " 無字天書 " ——

因為在公元 79 年，這組卷軸在一次火山爆發中被燒成了碳，1752 年才被挖掘出土。只要稍有不慎，脆弱的卷軸就會分分鍾變成殘片，想要通過物理方式展開，難如登天。

直到今時今日，三名大學生，終于借助 AI 的力量，成功破譯了其中的段落，打開了全新的考古研究範式。

他們通過給卷軸拍攝 CT 影像并借助機器學習技術分割識别，把卷軸中的 2000 餘個字元，揭示開來。

這一消息也迅速引發了全球轟動，目前為止，浏覽量已經超過了 1500 萬次，轉評贊接近 6 萬。

馬斯克也給三人團隊點了贊，表示這實在是泰褲辣。

DeepMind 的創始人 Demis 也大為贊嘆，還表示自己已經迫不及待地想要讀一讀這段神秘的文字了。

那麼，這份神秘的卷軸是如何一步步被破譯的呢？

不用打開，也能破譯内容

交出這份成果的，是三名學生組成的隊伍，他們分别是：

Youssef Nader，來自埃及，在德國柏林的一家院校攻讀博士

Luke Farritor，SpaceX 實習生，在内布拉斯加大學林肯分校計算機專業讀本科

Julian Schilliger，瑞士蘇黎世聯邦理工學院機器人專業碩士

想要在沒有損傷的前提下破譯這團被燒成碳的卷軸，打開看幾乎是不可能的。

1865 年，有人嘗試用物理方式把卷軸打開，結果以失敗告終，一部分卷軸直接成為了碎片。

此後近兩百年，便再也沒有人敢嘗試物理展開了。

直到 2019 年，肯塔基大學 EduceLab 的 Brent Seales 教授通過粒子加速器給卷軸拍攝了分辨率高達 4μm 的三維 CT 影像。

Seales 教授的博士生 Stephen Parsons 長期致力于使用機器學習模型檢測 CT 影像中的墨水，他利用已經展開的部分帶有可見墨水的卷軸碎片，建立了一個 ground-truth 數據集。

網友們對此事展開了熱烈讨論，并通過一場播客中傳到了 Luke 的耳朵。

這引起了他極大興趣，開始利用空餘時間訓練機器學習模型，以便對墨迹進行分析。

最終，Luke 的模型成功分析出了卷軸中肉眼不可見的符号，并發現了一個完整的單詞。

這個詞是希臘語的 "ΠΟΡΦΥΡΑ Ϲ "（小寫：πορφυ ̣ ρ ̣ ας ̣，拉丁轉寫：porphyras），意思與 " 紫色 " 相關。

這一發現，讓他成為歷史上第一個從赫庫蘭尼姆古卷内部讀出整個單詞的人。

Youssef 是第二個破譯出這個單詞的人，他采用了不同的方法，但得到了内容相同且更為清晰的結果。

也正是看到 Youssef 提交的結果之後，專家們對 Luke 的發現，更加确認了。

Julian 則參與研發了 EduceLab 的 3D 模型分割工具 Volume Cartographer。

Volume Cartographer 将三維 CT 影像沿卷軸展開，并映射到了二維平面，為 Luke 和 Youssef 的破譯工作奠定了基礎。

此後，Julian 又提出了新的分割方法 ThaumatoAnakalyptor，通過重新分割的方式對已破解區網域進行了驗證，并探索了更多未知片段。

此後，為了更快破譯出更多内容，三人組成了超級團隊，最終成功解讀出了 2000 多個字元。

他們使用了三種不同模型架構進行了分析，之間的結果可以相互印證，墨水檢測程式代碼還直接在 GitHub 上做了開源。

他們分析出的這兩千多個字元，位于其中一卷的結尾，篇幅大約是該卷的 5%，内容被認為與伊壁鸠魯哲學有關。伊壁鸠魯（Epicurus）是古希臘哲學家，主要關注個人的幸福和心靈的平靜，但講理性、在自然科學領網域提出了原子論，對後世的倫理學和心理學發展都產生了重要影響。

而在這個卷軸的兩個連續片段中，作者提及了商品（例如食物）的可獲得性（availability）是否以及如何影響它們能帶來的快樂（pleasure）。

所以這次考古發現，實際上或許能進一步幫助了解古人對于世界的認知和探究。

一場挑戰賽，三名學生，500 萬獎金

而讓這三名學生走到一起的，是一場名為 " 維蘇威火山 " 的挑戰賽。

在 Stephen 建立了數據集之後，矽谷企業家、GitHub 前 CEONat Friedman 對此產生了濃厚興趣，并出資贊助了這場比賽。

主辦方于去年 3 月公布了評選标準，參賽者需要破譯至少 4 個段落，每個段落 140 個字元，其中至少 85% 的字元可恢復。

當時，專家組普遍認為一年之内有人挑戰成功的概率還不到三成，但結果卻出乎意料——

據介紹，比賽的消息發布後他們收到了許多作品，直到 ddl 之前幾分鍾還有團隊交出成果。

經過為期一個月的審查，這份包含了 2000 個字元的文本，被認定破譯成功。

這三位獲獎者将瓜分 70 萬美元的獎金，折合人民币 500 多萬。

此外，還有三個團隊因提交的結果具有顯著可讀性，獲得了二等獎，這三個團隊将各獲得 5 萬美元的獎勵。

其中就包括谷歌華人工程師 Shao-Qian Mah 所帶領的團隊。

下一步，比賽主辦方希望在一年的時間内破譯四組卷軸的 90%，後續比賽信息也将在 3 月份公布。

當然，這樣的挑戰賽獎金只是一方面，更重要的是展現了如何用 AI 解決各行各業挑戰的可能性和可行性，包括考古這樣的學科。

或許你也有所耳聞，更早之前，AI 對于甲骨文的研究也開始了。你要還知道其他的項目？也歡迎分享分享～～