今天小编分享的科技经验:北欧监狱新工种:让囚犯训练AI大模型,报酬仅最低工资标准的八分之一,欢迎阅读。
划重点:
1 芬兰初创公司 Metroc 聘用监狱囚犯训练人工智能模型,每小时仅支付 12 元报酬,仅为该国最低工资标准的八分之一。2 OpenAI 等科技公司通过外包公司在全球雇佣数百万 " 点击工作者 " 训练人工智能模型,主要集中在低收入的南半球国家。3 在劳动力成本越来越高的今天,科技企业越来越多地转向几乎没有其他选择的人群 -- 难民、经济危机困扰国家的人口、囚犯。
相对于大型科技公司在南半球落后国家寻找廉价的数据劳工训练人工智能模型,在高福利的芬兰,科技公司很难寻找到数据劳工。在这一背景下,芬兰人工智能初创公司 Metroc 将目光投向了在监狱内服刑的犯人,借助这些廉价的劳动力来训练自己开发的模型。外媒实地走访,揭开了芬兰这种新型监狱劳动。以下为文章全文:
一个周三的早晨,我在一个没有窗户的房间里,隔着一张无菌的白色桌子,被介绍给一位 40 多岁的女士。她有着方形的下巴,淡蓝色的发带把金色的头发扎了起来。" 女孩们都叫我橘子酱(Marmalade)," 她说,也希望我这么称呼她。在芬兰一所监狱里服刑的橘子酱,将向我展示一种新型的监狱劳动。
除了一个装水的小塑料瓶和一台惠普筆記型電腦,这张白色的桌子上什么也没有放置。服刑期间,橘子酱每天轮班三小时,每小时能够得到 1.54 欧元(约合人民币 12 元)的报酬(2022 年芬兰最低工资标准为 13 欧元 / 小时,约合人民币 100 元)。这台筆記型電腦被编程为橘子酱播放关于房地产的短文,然后就刚刚阅读的内容要求她回答 " 是 " 或 " 不是 "。其中的一个问题问到:" 前一段是指房地产决策,而不是申请吗?"
" 这种工作确实有点枯燥," 橘子酱耸耸肩说。她也不完全确定这个练习的目的。她沉思道,也许她正在帮助开发一款客服聊天机器人。
事实上,橘子酱正在训练芬兰初创公司 Metroc 的大型语言模型。该公司开发了一个搜索引擎,旨在帮助建筑公司找到新批准的建筑项目。为此,Metroc 需要数据标签来帮助其模型理解新闻和市政檔案中关于即将出现的建筑项目的线索。例如,人工智能必须能够区分已经委托给建筑师或窗户装配工的医院建筑项目和可能仍在招聘的项目。
在全球各国,数以百万计的 " 点击工作者 " 正在训练人工智能模型,传授机器如何区分行人和棕榈树,或者用什么组合词汇来描述暴力或性虐待。通常这些人集中在南半球,因为那里的劳动力成本更低。比如,OpenAI 聘请一家外包公司在肯亞、乌干达和印度雇佣点击工人。这种安排适用于美国公司,因为它们使用世界上最广泛使用的语言 -- 英语。但是在南半球没有多少人会说芬兰语。
这就是 Metroc 聘请犯人为其工作的原因。这家初创公司得到了廉价的、讲芬兰语的工人,而监狱系统可以为服刑的犯人提供就业机会,据说这种作法可以让他们在获释后为数字世界的工作做好准备。利用囚犯来训练人工智能,与技术下游经常存在的低收入、有时是剥削性的劳动产生了令人不安的相似之处。但是在芬兰,Metroc 的这个项目得到了广泛的支持。
" 全球对数据劳工问题有一个共识。在芬兰发生的事情,如果你仔细观察就会发现非常不同," 一直研究芬兰监狱数据劳工问题的赫尔辛基大学研究人员图克卡 · 莱赫蒂涅米(Tuukka Lehtiniemi)说。
四个月来,橘子酱一直住在芬兰海门林纳监狱。这所监狱的建筑很现代,有大窗户。色彩鲜艳的艺术品试图在空荡荡的走廊上营造一种愉快的感觉。如果不是厚重的灰色安全门挡住了每个入口和出口,这些房间很容易属于一个特别没有灵魂的学校或大学建筑群。
芬兰可能因其开放式的监狱而闻名,囚犯可以在附近的城镇工作或学习。但海门林纳监狱与芬兰其他的监狱不同。海门林纳监狱是芬兰安全等级最高的监狱,专门关押女囚犯。橘子酱被判服刑六年。根据芬兰监狱制定的隐私条例,不能公布橘子酱的真实姓名、确切年龄或任何其他可以用来识别她的信息。但是在一个被判无期徒刑的囚犯可以在服刑 12 年后申请释放的国家,6 年的刑期是一个很重的判决。和住在这里的其他 100 名囚犯一样,橘子酱不允许离开海门林纳监狱。
当橘子酱刚进入海门林纳监狱开始服刑时,她会看着其他女犯人每天早上起床去工作:她们可以自愿打扫卫生,洗衣服,或者缝制自己的衣服。一个 6 小时的轮班,她们将得到大约 6 欧元(约合 6.50 美元)的报酬。但是橘子酱不情愿参加这样的劳动。" 我会觉得很累," 她说。相反,她在牢房里呆了很长时间。当一名监狱顾问建议她尝试 " 人工智能工作 " 时,短暂的三小时轮班对她很有吸引力。虽然报酬没有其他工作高,但总比没有的强。" 报酬虽然不多,但总比呆在牢房里好," 她说。到目前为止,橘子酱只参加了三次轮班,但她已经有了成就感。
海门林纳监狱是芬兰三所囚犯可以自愿通过数据劳动获得报酬的监狱之一。在这三所监狱中,都提供了三台筆記型電腦供犯人参与人工智能工作。这些工作没有为参与的囚犯设定目标。他们的报酬按小时计算,而不是按他们工作的速度或质量。坐在橘子酱身旁、留着一头短发的狱警明娜 · 因基宁(Minna Inkinen)说,在海门林纳监狱,大约有 20 名囚犯尝试过这种工作。" 有些人肯定比其他人更喜欢这项工作," 她说。
当我周三早晨到达海门林纳监狱时,缝纫室已经非常忙碌。囚犯们挤在缝纫机前,或者两人一组在成堆的布料前干活。但是人工智能工作的小房间在橘子酱到来之前完全是空的。因基宁说,目前总共只有三名囚犯自愿定期参加人工智能轮班,并解释说另外两人现在都在法庭上。" 我更喜欢在一个小组里做事," 橘子酱说,并补充说她一直开着门,这样她就可以在回答问题的间隙和隔壁缝纫室的人聊天。
橘子酱需要回答的所有问题,都是由位于监狱南部 100 千米外、位于赫尔辛基的一个共创空间内,由人工编辑的问题。在这里,我见到了 Metroc 高大而孩子气的创始人、首席执行官尤西 · 维尔纳(Jussi Virnala)。经过一排室内秋千、一张台球桌和一群穿西装的男人,他把我带到一个闷热的电话亭。这是激动人心的一周,他笑着解释道。Metroc 刚刚宣布了获得了一笔 200 万欧元(约合 210 万美元)的融资,他计划用这笔资金在北欧市场扩张。维尔纳说,与他交谈的投资者对该公司与芬兰监狱的关系很感兴趣。" 每个人都对这种创新的方式感兴趣,并为此感到兴奋," 他说。
去监狱寻找数据劳工正是维尔纳本人的主意。该公司需要母语为芬兰语的人来帮助改善其大型语言模型对建筑术语的理解。但在像芬兰这样的高工资经济体中,在市场中找到这样的数据劳工很难。芬兰福利体系中慷慨的失业福利,让芬兰人没有什么动力在亚马逊众包平台 Mechanical Turk 注册,然后寻觅很低收入的点击工作。"Mechanical Turk 几乎没有讲芬兰语的工人," 维尔纳拉说。他补充说,与此同时,芬兰语是一种只有 500 万母语使用者的语言,自动翻译工具仍不擅长翻译芬兰语。
当维尔纳向芬兰监狱和缓刑机构的智能监狱项目负责人皮娅 · 普奥拉卡(Pia Puolakka)兜售自己的构想时,普奥拉克立即产生了兴趣。在疫情之前,另一家名为 Vainu 的芬兰科技公司一直在使用囚犯从事数据劳动。但在联合创始人之间的分歧导致该项目的公司负责人离职后,Vainu 退出了与芬兰智能监狱项目的合作。
当维尔纳在 2022 年提出建议时,普奥拉卡渴望复活人工智能工作。她的工作是试图让芬兰监狱和互联网之间的关系更接近日益数字化的外部世界。到目前为止,她已经在每个牢房里安装了筆記型電腦,这样囚犯们就可以浏览受限的网站列表,并申请视频通话的许可。她认为数据劳动是自己任务的另一部分。
普奥拉卡的目的不是取代如制作路标或园艺等传统的监狱劳动,而是给犯人提供更多的劳动选择。数据标注只能三小时一班。" 这种工作每天干八个小时可能会很累," 她说,并补充说,如果囚犯和其他类型的监狱劳动一起做数据标签会很好。" 这种类型的工作是未来,如果我们想让囚犯为监狱外的生活做好准备,过一种没有犯罪的生活,这些类型的技能可能至少与监狱提供的传统工作类型一样重要," 她说。
但是这种工作给囚犯们提供了多少可以在出狱后转移到工作中的技能还不得而知。曾管理过一年多监狱项目的 Vainu 联合创始人图奥马斯 · 拉西拉(Tuomas Rasila)他承认,他没有这方面的证据。他说,这个项目运行的时间不够长,不足以收集数据。" 我认为,让那些可能感觉置身于社会之外的人接受现代社会最高科技方面的培训,是一个令人振奋的想法," 拉西拉说。
不过也有一些人认为,这种新形式的监狱劳动是支撑人工智能革命的廉价劳动力热潮的一部分。专注于人工智能的高级研究员阿莫斯 · 托赫(Amos Toh)表示:" 我们正在走向更方便、更高效的全自动社会的说法,往往会掩盖这样一个事实,即许多这些系统都是由人工驱动的。" 在托赫看来,加速寻找所谓的点击工作者创造出一种趋势,即企业越来越多地转向几乎没有其他选择的人群:难民、受经济危机困扰的国家的人口,如今还包括了囚犯。
" 这种动态是我们非常熟悉的," 托赫说。" 我们在这里看到的是更广泛现象的一部分,建筑技术背后的劳动被外包给可能在剥削性工作条件下辛勤工作的工人。" 托赫还质疑数据劳动是否能帮助囚犯建立数字技能。他说:" 监狱里的人可以通过很多方式提升自己,比如获得证书和参加高等教育。但我怀疑以每小时 1 欧元的价格为一家公司做数据标记是否会带来有意义的进步。" 海门林纳监狱确实为囚犯提供人工智能在线课程,但当工作人员试图解释这些课程的好处时,橘子酱却面无表情。
当我见到来自赫尔辛基大学的研究员莱赫蒂涅米时,我还对监狱项目的优点感到困惑。从监狱直接前往 Metroc 公司办公室的整个过程让我感觉不太舒服,因为监狱的犯人每小时只能获得 1.54 欧元的报酬,而 Metroc 却在庆祝自己获得了 2000 万欧元的估值。在宏伟的圆顶赫尔辛基大教堂对面的一家咖啡馆里,莱赫蒂涅米耐心地听我描述那种感觉。
不过莱赫蒂涅米自己对囚犯的采访让他有了不同的看法,他对这个项目总体上是积极的。对于我关于薪酬差距的观点,他认为囚犯并不是主流社会中的普通劳动力。" 比较我作为一名研究人员的收入和囚犯在监狱里的劳动所得,这是没有意义的," 他说。" 我听到的唯一负面消息是,这项工作做得不够。只有少数人能做到这一点," 他说,指的是每座监狱只有三台筆記型電腦的限制。
" 当我们想到数据劳动时,我们往往会想到 Mechanical Turk、南半球或美国农村的劳动力," 他说。但对他而言,这是一个独特的本地版本的数据劳动,伴随着有益于社会的扭曲。与其他监狱劳动选择相比,它给囚犯提供了认知刺激的工作,同时也代表了芬兰语言在人工智能革命中的地位。
如果没有这种主动性,莱赫蒂涅米担心非英语语言会被这种下一代技术拒之门外。对普通的语言学习者而言,芬兰语方言更是难上加难。" 不是所有的芬兰人英语都讲得很好,所以也需要这些本土形式的数据标签," 莱赫蒂涅米说。Metroc 并不是唯一一家被迫创造性地寻找芬兰数据劳工的公司。2011 年,芬兰国家图书馆创建了一个游戏来激励志愿者帮助数字化其档案。2020 年,广播公司 YLE 与赫尔辛基大学和国家开发公司 VAKE 合作,要求志愿者捐赠他们说芬兰语的录音。
目前还不清楚的是,芬兰监狱的劳动条件 -- 众所周知的以改造为主 -- 是否可以在其他司法方式不那么进步的国家复制。根据一项数据,在美国,76% 的囚犯报告说监狱劳动是强制性的。" 美国的监狱系统与我们在芬兰或北欧国家的监狱系统非常不同。这是一个完全不同的想法," 拉西拉说。" 在芬兰,围绕数据劳工项目有一种完全积极的感觉,因为每个人都知道这是非常自愿的。"
人工智能公司只会需要更多的数据劳工,迫使他们不断寻找越来越不寻常的劳动力来跟上步伐。随着 Metroc 计划将其业务扩展到北欧和芬兰语以外的语言,维尔纳正在考虑是否将监狱里的数据劳工项目扩展到其他国家。" 这是我们需要探索的东西," 他说。