谷歌暂停Gemini人像生成功能，因其试图改变种族和性别偏见却产生新问题

今天小编分享的互联网经验：谷歌暂停Gemini人像生成功能，因其试图改变种族和性别偏见却产生新问题，欢迎阅读。

谷歌旗下大模型 Gemini 根据提示词 " 美国开国元勋（founding father）" 生成的影像之一。图片来源：New York Post 转引自 Gemini

近日，谷歌表示，在发现其旗下大模型 Gemini 生成不准确的历史人物影像后，该公司将暂停该 AI 工具的人物影像生成功能。

此前，一些用户曾向 Gemini 请求历史人物的影像，结果发现生成的人像的肤色错误。例如，在请求生成美国开国元勋（founding father）时，Gemini 生成的人像包括非裔、原住民。

Gemini 根据提示词 " 美国开国元勋 " 生成的人像。图片来源：《Reason》杂志引用的 Gemini 生成的图片

在另一些场景下，在请求生成 "1943 年德国士兵的影像 " 时，Gemini 生成结果中包括亚裔和非裔。

Gemini 根据提示词 "1943 年德国士兵 " 生成的影像，结果包括黑人和亚裔。图片来源：The Verge 引用的 Gemini 生成的图片。

谷歌在 X 上发布声明：" 我们已经在努力解决最近 Gemini 影像生成功能的问题。同时，我们将暂停人物影像生成的功能，并将很快重新发布改进后的新版本。"

Gemini 是谷歌开发的大语言模型。今年 2 月 16 日，谷歌推出 Gemini 1.5 Pro 版本，其最大特点是上下文視窗长度达到 100 万 token，创下了最长上下文視窗的纪录。上下文越长，大模型越能够洞察文档中的对话、事件和细节，展现出对复杂信息的深刻理解。Gemini 具有跨模态能力，横跨不同媒介，可以直接投喂视频，上传的视频会被拆抽成数千个画面（不包括音频）来进行分析。

Gemini 生成错误肤色的人像问题在美国社交平台上引起争议。专栏作家 Douglas Murray 于 2 月 23 日在社交平台 X 上表示：" 谷歌向我们宣扬人种多样性的努力超出了人工智能的范畴。" 特斯拉 CEO Elon Musk 则转发推文并表示：" 这不只是 Google Gemini 的问题，还有 Google 搜索（意指 Google 搜索中也会出现类似的误差）。"

此前，Elon Musk 还于 2 月 23 日发了另一条推文：" 我很高兴谷歌夸大了他们的人工智能影像生成，因为这让所有人都清楚了他们疯狂的种族主义、反文明编程。"

据编辑、评论家 Douglas Murray 称，Gemini 中影像生成人像肤色错误的现象，来源于机器学习公平性（machine learning fairness），" 人类充满了隐性偏见，因此，我们需要机器抛出公正的影像。"

一些人认为 Gemini 的 AI 影像本质上是在消除种族歧视和性别歧视的历史，而另一些人则认为 Gemini 的 AI 影像背后是谷歌在试图操控 2024 美国大选偏向有利于民主党的方向。Elon Musk 转发推文：" 谷歌通过搜索和 YouTube 控制了数十亿人的思想。他们对西方文明造成了巨大的损害。"

由于大模型的机制是，根据投喂的数据库中各种事件出现的统计概率，来根据上文来推测下文，因此大模型倾向不完美地 " 填补空白 "，因此容易 " 瞎编 "，出现 " 幻觉 "。当大语言模型的训练数据集中关于所提出问题的信息受限、过时或具有矛盾时，它们也会产生幻觉。大模型的幻觉对于其在企业级、医疗级等应用场景中是致命的。

蓝鲸财经记者测试国内一些大语言模型时，发现其生成的人像也容易产生类似问题。例如，向百度开发的大模型 " 文心一言 " 给出提示词 " 请生成 1943 年德国士兵的影像 "，结果生成了一个亚裔士兵的影像。阿里巴巴开发的大模型 " 通义千问 " 则生成了正确肤色的人像。

文心一言根据提示词 "1943 年德国士兵 " 生成的人像。图片来源：文心一言

由于 ChatGPT 以来的人工智能引起了新一波狂热，人工智能导致的内容隐患也层出不穷。今年 1 月下旬，Deep Fake（深伪，基于机器学习和人工智能以生成欺骗性影像语音的技术）伪造的美国歌手 Taylor Swift 的色情影像在社交媒体平台 4chan 和 X 上大量传播。几张带有性或暴力性质的人造影像迅速传播，据报道，其中一篇帖子在最终被删除之前已被浏览超过 4700 万次。此事件促使 Microsoft 增强了 Microsoft Designer 的文生图模型，以防止被滥用。