今天小編分享的科技經驗:北歐的囚犯,正在訓練AI,歡迎閱讀。
作者老 K 編輯硬 AI
一個陽光明媚的周三早上,我走進了一個沒有窗戶的白色房間。房間裡,擺着一張幹淨的白色桌子,桌邊,坐着一位約莫四十出頭的中年女性。
她的背挺的很直,金色的頭發用淡藍色的發圈束在腦後。見我來了,她将目光從桌上的惠普筆記本上移開,微微一笑,略有些疲憊地向我介紹:" 姑娘們都叫我果醬 "。
在高工資的芬蘭,這樣的數據标注員并不多見,直到一家公司想到了一個 " 絕妙的 " 點子——囚犯。
在每個三小時的數據标注輪班裡,犯人們能得到 1.54 歐元(約 1.67 美元)的報酬。
這時,果醬女士的電腦螢幕上跳出了一篇關于房地產的短文,讓她來做 " 閱讀理解 "。其中的一個問題是:" 第一段說的是房地產政策,還是購房建議?"
果醬聳了聳肩,她覺得有點無聊——她也不太知道這項任務的意義。" 也許我正在訓練一個 ChatGPT 呢?",她略帶自嘲地喃喃自語。
事實上,她正在培訓 Metroc 擁有的一款大型語言模型,這家芬蘭初創公司試圖創建一個 AI 搜索引擎,幫助建築公司找到新獲批的建築項目。
為了做到這一點,Metroc 需要招募精通芬蘭語的數據标注工人,幫助其模型理解相關新聞文章和市政檔案。
上一代的 " 數據标注師 ",主要工作以 " 打點 " 和 " 畫框 " 為主,教機器學習什麼是 " 人臉 ",什麼是 " 障礙物 "。而新一代的數據标注師,主要工作則更像是做閱讀理解,需要幫大模型找錯、修改、打分,教會大模型應該生成什麼樣的内容。
在全球範圍内,數百萬的 " 數據标注師 " 正訓練着各種 AI 模型。通常,這些工作者分布在工資水平較低的非洲、印度等地區。不過,對于不想在生成式 AI 競争浪潮中掉隊的芬蘭等歐洲小國而言,這裡的員工并不合适——他們看不懂芬蘭語。
這就是為什麼 Metroc 會打起監獄的點子——這裡有便宜的、講芬蘭語的勞動力,花少量人力成本訓練出個 AI,就能搞到一筆不菲的融資。
與此同時,監獄系統也很樂意為囚犯提供這些 " 不一樣 " 的就業機會,雙方一拍即合。
監獄裡的「數據标注師」
被收押以來,果醬女士一直被關在 Hämeenlinna 監獄。
這座建築物現代化,有着大大的窗戶、色彩斑斓的藝術品。如果不是每個入口和出口都被沉重的灰色安全門擋住,這些房間很容易被誤認為是一所還不錯的大學。
芬蘭可能以其開放式監獄而聞名——在這些監獄裡,囚犯可以在附近的城鎮工作或學習——但這座監獄不是。相反,Hämeenlinna 是該國安全級别最高的監獄之一,且只收容女性囚犯。
果醬女士被判處了六年徒刑——在一個囚犯服刑 12 年後可以申請釋放的國家,六年徒刑堪稱是一個重判。
當果醬第一次來到監獄時,她常常看着其他女囚每天早上起床去工作:她們可以自願做清潔、洗衣服,或者縫制衣物等工作。每六小時的工作,她們可以獲得大約 6 歐元(6.50 美元)的報酬。
但果醬不想參與其中—— " 我覺得會很累 ",她說。
因此,她選擇了長時間悶在自己的牢房裡。當一位監獄顧問建議她嘗試 "AI 工作 " 時,只用三小時的 " 短暫 " 工作時間吸引了她,而且,相比于什麼也不幹,多少賺點也算是好的。" 盡管不多,但總比呆在牢房裡強 ",她說。盡管目前她只完成了三個輪班,但她表示,自己已經感到了一種成就感。
Hämeenlinna 是芬蘭三所提供 " 數據标注師 " 的監獄之一。這三所監獄中,每個監獄都有三台筆記型電腦,以供囚犯參與這項 AI 工作。
工作沒有明确目标,工資按小時結算,而不是根據工作速度或者工作質量發放。
監獄的 " 工作導師 " 米娜 · 英基寧坐在果醬女士旁邊,她留着剪短的紅發,表示,在 Hämeenlinna 監獄,大約有 20 名囚犯嘗試過這項工作。" 有些人肯定比其他人更喜歡這項工作 ",她說。
不過,當我到達監獄時,卻發現,縫紉室已經很忙碌了,但 AI 工作的小房間卻只有果醬一個人。
對此,英基寧解釋稱,目前只有三名囚犯定期自願參加 AI 輪班,其他兩人目前正在接受法庭審判。
" 我更喜歡和一組人一起做 ",果醬說。她補充道,她喜歡保持房門敞開,這樣可以在回答問題的同時與隔壁縫紉機室的人一塊聊聊天。
這些問題是在監獄南部 100 公裡外的赫爾辛基編寫的。在那裡,我見到了 Metroc 公司的創始人兼首席執行官尤西 · 維爾納拉。
在他們現代、時尚、漂亮的辦公室裡,他笑着對我說,他們剛剛度過了一個激動人心的一周,公司剛剛宣布了 200 萬歐元(210 萬美元)的最新一輪融資,他計劃用這筆錢向北歐擴展業務。
他表示,在與投資者的談話中,他感受到了投資者對于 " 芬蘭監獄 " 的熱情:
每個人,都對這種創新方式感到興奮。
我認為,從產品角度來看,這也是非常有價值的。
将監獄作為勞工來源,是維爾納拉的主意。如前所述,這家芬蘭的初創公司需要母語為芬蘭語的标注員,以幫助提高其大型語言模型對建築特定語言的理解。
在像芬蘭這樣高工資的經濟體中,尋找這些數據勞工非常困難。由于芬蘭有着 " 非常慷慨 " 的失業救濟福利制度,幾乎沒有芬蘭人願意幹一些低工資的外包活(例如亞馬遜的 Mechanical Turk)。
"Mechanical Turk 幾乎沒有多少芬蘭語的工人," 維爾納拉說。他補充道,自動翻譯工具對芬蘭語仍然無能為力,這是一種母語人口僅有 500 萬人的 " 小語種 "。
為囚犯提供「多樣化」工作選擇
當維爾納拉向芬蘭監獄和緩刑機構的智能監獄項目負責人皮亞 · 普拉卡提出他的建議時,後者立刻表現出濃厚興趣。
普拉卡表示,在新冠疫情之前,另一家名為 Vainu 的芬蘭科技公司曾利用囚犯進行數據勞工。但由于聯合創始人之間的分歧、該項目負責人離開公司,這個項目不了了之。
所以,當維爾納拉在 2022 年提出自己的建議時,普拉卡也非常渴望重新啟動 AI 工作。普拉卡認為,監獄提供此類 AI 工作,目标并不在于取代傳統的監獄工作,如制作道路标志或園藝工作。而是為囚犯提供更多選擇。
數據标注一天只能幹三小時。" 如果每天做 8 小時只有這種工作,可能會很累 ",她說,并補充稱,如果囚犯可以在進行數據标注的同時參與其他類型的監獄勞工,那将是很好的:
這種工作是未來,如果我們想要幫助囚犯适應監獄外的生活,這些技能可能至少與監獄提供的傳統工種一樣重要。
不過,沒人清楚,數據标注工作究竟能為囚犯出獄之後的生活提供多少價值。曾管理 Vainu 監獄一年的圖奧馬斯 · 拉西拉承認,他沒有證據表明這一點。他說,該項目沒有運行足夠長的時間來收集這些證據。
還有專家認為,這種新形式的監獄勞動是對廉價勞動力剝削的一部分,而廉價勞動力正是人工智能革命的基礎。
研究人工智能的高級研究員阿莫斯 · 托表示,需求量越來越大的數據标注員,會促使公司越來越多地轉向那些幾乎沒有其他選擇的群體,比如 " 難民、陷入經濟危機的國家的人口,以及現在的囚犯。"
托對數據勞工是否能幫助囚犯建立數字技能,也持懷疑态度。他表示:
監獄裡的人有很多方式來提高自己,比如獲得證書和參加教育。
對于以每小時一歐元的價格為公司進行數據标注是否會帶來有意義的進展,我持懷疑态度。
回答 Hämeenlinna 監獄,這所監獄确實為囚犯提供了人工智能在線課程,但果醬只是坐在那裡,面無表情地看着電腦 ……
小國 AI 的「無奈之舉」
将監獄與 Metroc 辦公室對比,女囚們每小時只能獲得 1.54 歐元的報酬,而公司正在慶祝獲得 2000 萬歐元的融資——多少有點不太協調,我對監獄項目的價值感到有些矛盾。
在赫爾辛基大教堂對面的一家咖啡館裡,我耐心地向赫爾辛基大學的研究員萊赫蒂尼米描述了我的感受。
對此,他表示,他認為這些勞動力不是主流社會中的普通勞工。這些人在監獄裡," 比較我作為研究員獲得的錢和囚犯為他們的監獄勞工獲得的錢,這沒有意義 "。他補充稱:
我聽到的唯一負面,就是目前的崗位還不夠多。只有很少的人可以做它。
進一步,萊赫蒂尼米分析稱," 當我們思考數據勞工時,我們傾向于想到 Mechanical Turk,想到全球南部或美國農村的人," 但這種做法提供了一種獨特的本地數據勞工,不僅有益社會,也為囚犯提供了 " 腦力工作 " 機會。同時,這也增強了芬蘭語在人工智能革命中的地位。
萊赫蒂尼米擔心,如果沒有這種做法,非英語語言可能會被排除在下一代技術之外:
智能音響仍然難以理解芬蘭方言,不是所有芬蘭人都很流利地講英語,所以這些本地形式的數據标注也是必需的。
值得一提的是,Metroc 也并不是不得已尋找芬蘭數據勞工的唯一公司。
2011 年,芬蘭國家圖書館創建了一個遊戲,以激勵志願者幫助數字化其檔案。在 2020 年,芬蘭廣播公司 YLE 與赫爾辛基大學和國家發展公司 VAKE 合作,尋求志願者捐贈他們講芬蘭語的錄音。
「芬蘭模式」or 「不良先例」
有些人擔心,這種做法可能樹立了一個 " 不良先例 ",可能會将更多有争議的數據标注類型引入監獄,比如審查暴力内容。
研究人工智能的高級研究員阿莫斯 · 托表示:
即使目前在芬蘭标注的數據是毫無争議的,我們也必須考慮它所樹立的先例。
如果公司看到這是一個未被開發的勞動力池,會有什麼能阻止他們将創傷和令人不快的内容的數據标注外包給監獄裡的人?
目前,尚不清楚這種 " 芬蘭模式 " 能否在其他國家復制。
根據公民權利組織美國公民自由聯盟(ACLU)的數據,76% 的囚犯報告稱監獄勞工是強制性的。拉西拉說:
美國的監獄系統與芬蘭或北歐國家的監獄系統完全不同。這是一個完全不同的理念。
在芬蘭,人們對這個項目都持完全積極的态度,因為每個人都知道這是自願的。
人工智能公司将需要更多的數據勞工,這将迫使它們不斷尋找越來越 " 非常 " 的勞動力來保持競争。
随着 Metroc 計劃擴展到北歐其他地區和芬蘭之外的語言,維爾納拉正在考慮将監獄勞工項目擴展到其他國家。
" 這是我們需要探索的事情," 他說。
本文編譯自:
https://www.wired.com/story/prisoners-training-ai-finland/?redirectURL=https%3A%2F%2Fwww.wired.com%2Fstory%2Fprisoners-training-ai-finland%2F
本文不構成個人投資建議,不代表平台觀點,市場有風險,投資需謹慎,請獨立判斷和決策。