今天小編分享的科技經驗:北歐監獄新工種:讓囚犯訓練AI大模型,報酬僅最低工資标準的八分之一,歡迎閱讀。
劃重點:
1 芬蘭初創公司 Metroc 聘用監獄囚犯訓練人工智能模型,每小時僅支付 12 元報酬,僅為該國最低工資标準的八分之一。2 OpenAI 等科技公司通過外包公司在全球雇傭數百萬 " 點擊工作者 " 訓練人工智能模型,主要集中在低收入的南半球國家。3 在勞動力成本越來越高的今天,科技企業越來越多地轉向幾乎沒有其他選擇的人群 -- 難民、經濟危機困擾國家的人口、囚犯。
相對于大型科技公司在南半球落後國家尋找廉價的數據勞工訓練人工智能模型,在高福利的芬蘭,科技公司很難尋找到數據勞工。在這一背景下,芬蘭人工智能初創公司 Metroc 将目光投向了在監獄内服刑的犯人,借助這些廉價的勞動力來訓練自己開發的模型。外媒實地走訪,揭開了芬蘭這種新型監獄勞動。以下為文章全文:
一個周三的早晨,我在一個沒有窗戶的房間裡,隔着一張無菌的白色桌子,被介紹給一位 40 多歲的女士。她有着方形的下巴,淡藍色的發帶把金色的頭發扎了起來。" 女孩們都叫我橘子醬(Marmalade)," 她說,也希望我這麼稱呼她。在芬蘭一所監獄裡服刑的橘子醬,将向我展示一種新型的監獄勞動。
除了一個裝水的小塑料瓶和一台惠普筆記型電腦,這張白色的桌子上什麼也沒有放置。服刑期間,橘子醬每天輪班三小時,每小時能夠得到 1.54 歐元(約合人民币 12 元)的報酬(2022 年芬蘭最低工資标準為 13 歐元 / 小時,約合人民币 100 元)。這台筆記型電腦被編程為橘子醬播放關于房地產的短文,然後就剛剛閱讀的内容要求她回答 " 是 " 或 " 不是 "。其中的一個問題問到:" 前一段是指房地產決策,而不是申請嗎?"
" 這種工作确實有點枯燥," 橘子醬聳聳肩說。她也不完全确定這個練習的目的。她沉思道,也許她正在幫助開發一款客服聊天機器人。
事實上,橘子醬正在訓練芬蘭初創公司 Metroc 的大型語言模型。該公司開發了一個搜索引擎,旨在幫助建築公司找到新批準的建築項目。為此,Metroc 需要數據标籤來幫助其模型理解新聞和市政檔案中關于即将出現的建築項目的線索。例如,人工智能必須能夠區分已經委托給建築師或窗戶裝配工的醫院建築項目和可能仍在招聘的項目。
在全球各國,數以百萬計的 " 點擊工作者 " 正在訓練人工智能模型,傳授機器如何區分行人和棕榈樹,或者用什麼組合詞匯來描述暴力或性虐待。通常這些人集中在南半球,因為那裡的勞動力成本更低。比如,OpenAI 聘請一家外包公司在肯亞、烏幹達和印度雇傭點擊工人。這種安排适用于美國公司,因為它們使用世界上最廣泛使用的語言 -- 英語。但是在南半球沒有多少人會說芬蘭語。
這就是 Metroc 聘請犯人為其工作的原因。這家初創公司得到了廉價的、講芬蘭語的工人,而監獄系統可以為服刑的犯人提供就業機會,據說這種作法可以讓他們在獲釋後為數字世界的工作做好準備。利用囚犯來訓練人工智能,與技術下遊經常存在的低收入、有時是剝削性的勞動產生了令人不安的相似之處。但是在芬蘭,Metroc 的這個項目得到了廣泛的支持。
" 全球對數據勞工問題有一個共識。在芬蘭發生的事情,如果你仔細觀察就會發現非常不同," 一直研究芬蘭監獄數據勞工問題的赫爾辛基大學研究人員圖克卡 · 萊赫蒂涅米(Tuukka Lehtiniemi)說。
四個月來,橘子醬一直住在芬蘭海門林納監獄。這所監獄的建築很現代,有大窗戶。色彩鮮豔的藝術品試圖在空蕩蕩的走廊上營造一種愉快的感覺。如果不是厚重的灰色安全門擋住了每個入口和出口,這些房間很容易屬于一個特别沒有靈魂的學校或大學建築群。
芬蘭可能因其開放式的監獄而聞名,囚犯可以在附近的城鎮工作或學習。但海門林納監獄與芬蘭其他的監獄不同。海門林納監獄是芬蘭安全等級最高的監獄,專門關押女囚犯。橘子醬被判服刑六年。根據芬蘭監獄制定的隐私條例,不能公布橘子醬的真實姓名、确切年齡或任何其他可以用來識别她的信息。但是在一個被判無期徒刑的囚犯可以在服刑 12 年後申請釋放的國家,6 年的刑期是一個很重的判決。和住在這裡的其他 100 名囚犯一樣,橘子醬不允許離開海門林納監獄。
當橘子醬剛進入海門林納監獄開始服刑時,她會看着其他女犯人每天早上起床去工作:她們可以自願打掃衛生,洗衣服,或者縫制自己的衣服。一個 6 小時的輪班,她們将得到大約 6 歐元(約合 6.50 美元)的報酬。但是橘子醬不情願參加這樣的勞動。" 我會覺得很累," 她說。相反,她在牢房裡呆了很長時間。當一名監獄顧問建議她嘗試 " 人工智能工作 " 時,短暫的三小時輪班對她很有吸引力。雖然報酬沒有其他工作高,但總比沒有的強。" 報酬雖然不多,但總比呆在牢房裡好," 她說。到目前為止,橘子醬只參加了三次輪班,但她已經有了成就感。
海門林納監獄是芬蘭三所囚犯可以自願通過數據勞動獲得報酬的監獄之一。在這三所監獄中,都提供了三台筆記型電腦供犯人參與人工智能工作。這些工作沒有為參與的囚犯設定目标。他們的報酬按小時計算,而不是按他們工作的速度或質量。坐在橘子醬身旁、留着一頭短發的獄警明娜 · 因基寧(Minna Inkinen)說,在海門林納監獄,大約有 20 名囚犯嘗試過這種工作。" 有些人肯定比其他人更喜歡這項工作," 她說。
當我周三早晨到達海門林納監獄時,縫紉室已經非常忙碌。囚犯們擠在縫紉機前,或者兩人一組在成堆的布料前幹活。但是人工智能工作的小房間在橘子醬到來之前完全是空的。因基寧說,目前總共只有三名囚犯自願定期參加人工智能輪班,并解釋說另外兩人現在都在法庭上。" 我更喜歡在一個小組裡做事," 橘子醬說,并補充說她一直開着門,這樣她就可以在回答問題的間隙和隔壁縫紉室的人聊天。
橘子醬需要回答的所有問題,都是由位于監獄南部 100 千米外、位于赫爾辛基的一個共創空間内,由人工編輯的問題。在這裡,我見到了 Metroc 高大而孩子氣的創始人、首席執行官尤西 · 維爾納(Jussi Virnala)。經過一排室内秋千、一張台球桌和一群穿西裝的男人,他把我帶到一個悶熱的電話亭。這是激動人心的一周,他笑着解釋道。Metroc 剛剛宣布了獲得了一筆 200 萬歐元(約合 210 萬美元)的融資,他計劃用這筆資金在北歐市場擴張。維爾納說,與他交談的投資者對該公司與芬蘭監獄的關系很感興趣。" 每個人都對這種創新的方式感興趣,并為此感到興奮," 他說。
去監獄尋找數據勞工正是維爾納本人的主意。該公司需要母語為芬蘭語的人來幫助改善其大型語言模型對建築術語的理解。但在像芬蘭這樣的高工資經濟體中,在市場中找到這樣的數據勞工很難。芬蘭福利體系中慷慨的失業福利,讓芬蘭人沒有什麼動力在亞馬遜眾包平台 Mechanical Turk 注冊,然後尋覓很低收入的點擊工作。"Mechanical Turk 幾乎沒有講芬蘭語的工人," 維爾納拉說。他補充說,與此同時,芬蘭語是一種只有 500 萬母語使用者的語言,自動翻譯工具仍不擅長翻譯芬蘭語。
當維爾納向芬蘭監獄和緩刑機構的智能監獄項目負責人皮娅 · 普奧拉卡(Pia Puolakka)兜售自己的構想時,普奧拉克立即產生了興趣。在疫情之前,另一家名為 Vainu 的芬蘭科技公司一直在使用囚犯從事數據勞動。但在聯合創始人之間的分歧導致該項目的公司負責人離職後,Vainu 退出了與芬蘭智能監獄項目的合作。
當維爾納在 2022 年提出建議時,普奧拉卡渴望復活人工智能工作。她的工作是試圖讓芬蘭監獄和互聯網之間的關系更接近日益數字化的外部世界。到目前為止,她已經在每個牢房裡安裝了筆記型電腦,這樣囚犯們就可以浏覽受限的網站列表,并申請視頻通話的許可。她認為數據勞動是自己任務的另一部分。
普奧拉卡的目的不是取代如制作路标或園藝等傳統的監獄勞動,而是給犯人提供更多的勞動選擇。數據标注只能三小時一班。" 這種工作每天幹八個小時可能會很累," 她說,并補充說,如果囚犯和其他類型的監獄勞動一起做數據标籤會很好。" 這種類型的工作是未來,如果我們想讓囚犯為監獄外的生活做好準備,過一種沒有犯罪的生活,這些類型的技能可能至少與監獄提供的傳統工作類型一樣重要," 她說。
但是這種工作給囚犯們提供了多少可以在出獄後轉移到工作中的技能還不得而知。曾管理過一年多監獄項目的 Vainu 聯合創始人圖奧馬斯 · 拉西拉(Tuomas Rasila)他承認,他沒有這方面的證據。他說,這個項目運行的時間不夠長,不足以收集數據。" 我認為,讓那些可能感覺置身于社會之外的人接受現代社會最高科技方面的培訓,是一個令人振奮的想法," 拉西拉說。
不過也有一些人認為,這種新形式的監獄勞動是支撐人工智能革命的廉價勞動力熱潮的一部分。專注于人工智能的高級研究員阿莫斯 · 托赫(Amos Toh)表示:" 我們正在走向更方便、更高效的全自動社會的說法,往往會掩蓋這樣一個事實,即許多這些系統都是由人工驅動的。" 在托赫看來,加速尋找所謂的點擊工作者創造出一種趨勢,即企業越來越多地轉向幾乎沒有其他選擇的人群:難民、受經濟危機困擾的國家的人口,如今還包括了囚犯。
" 這種動态是我們非常熟悉的," 托赫說。" 我們在這裡看到的是更廣泛現象的一部分,建築技術背後的勞動被外包給可能在剝削性工作條件下辛勤工作的工人。" 托赫還質疑數據勞動是否能幫助囚犯建立數字技能。他說:" 監獄裡的人可以通過很多方式提升自己,比如獲得證書和參加高等教育。但我懷疑以每小時 1 歐元的價格為一家公司做數據标記是否會帶來有意義的進步。" 海門林納監獄确實為囚犯提供人工智能在線課程,但當工作人員試圖解釋這些課程的好處時,橘子醬卻面無表情。
當我見到來自赫爾辛基大學的研究員萊赫蒂涅米時,我還對監獄項目的優點感到困惑。從監獄直接前往 Metroc 公司辦公室的整個過程讓我感覺不太舒服,因為監獄的犯人每小時只能獲得 1.54 歐元的報酬,而 Metroc 卻在慶祝自己獲得了 2000 萬歐元的估值。在宏偉的圓頂赫爾辛基大教堂對面的一家咖啡館裡,萊赫蒂涅米耐心地聽我描述那種感覺。
不過萊赫蒂涅米自己對囚犯的采訪讓他有了不同的看法,他對這個項目總體上是積極的。對于我關于薪酬差距的觀點,他認為囚犯并不是主流社會中的普通勞動力。" 比較我作為一名研究人員的收入和囚犯在監獄裡的勞動所得,這是沒有意義的," 他說。" 我聽到的唯一負面消息是,這項工作做得不夠。只有少數人能做到這一點," 他說,指的是每座監獄只有三台筆記型電腦的限制。
" 當我們想到數據勞動時,我們往往會想到 Mechanical Turk、南半球或美國農村的勞動力," 他說。但對他而言,這是一個獨特的本地版本的數據勞動,伴随着有益于社會的扭曲。與其他監獄勞動選擇相比,它給囚犯提供了認知刺激的工作,同時也代表了芬蘭語言在人工智能革命中的地位。
如果沒有這種主動性,萊赫蒂涅米擔心非英語語言會被這種下一代技術拒之門外。對普通的語言學習者而言,芬蘭語方言更是難上加難。" 不是所有的芬蘭人英語都講得很好,所以也需要這些本土形式的數據标籤," 萊赫蒂涅米說。Metroc 并不是唯一一家被迫創造性地尋找芬蘭數據勞工的公司。2011 年,芬蘭國家圖書館創建了一個遊戲來激勵志願者幫助數字化其檔案。2020 年,廣播公司 YLE 與赫爾辛基大學和國家開發公司 VAKE 合作,要求志願者捐贈他們說芬蘭語的錄音。
目前還不清楚的是,芬蘭監獄的勞動條件 -- 眾所周知的以改造為主 -- 是否可以在其他司法方式不那麼進步的國家復制。根據一項數據,在美國,76% 的囚犯報告說監獄勞動是強制性的。" 美國的監獄系統與我們在芬蘭或北歐國家的監獄系統非常不同。這是一個完全不同的想法," 拉西拉說。" 在芬蘭,圍繞數據勞工項目有一種完全積極的感覺,因為每個人都知道這是非常自願的。"
人工智能公司只會需要更多的數據勞工,迫使他們不斷尋找越來越不尋常的勞動力來跟上步伐。随着 Metroc 計劃将其業務擴展到北歐和芬蘭語以外的語言,維爾納正在考慮是否将監獄裡的數據勞工項目擴展到其他國家。" 這是我們需要探索的東西," 他說。