今天小编分享的科技经验:OpenAI o3 / o4-mini 模型AI生成文本含特殊符号,推测为隐形水印,欢迎阅读。
IT 之家 4 月 22 日消息,AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字元。
IT 之家注:这些字元在普通视图中与标准空格无异,但在 SoSciSurvey 或 Sublime Text 等专业工具中,可检测其独特代码。
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,并不存在这些設定,这些选项可以通过简单的 " 查找替换 " 移除,推测这可能是 OpenAI 故意設定的水印。
Rumi 强调,这种字元检测方法误报率极低,但易被绕过的缺陷明显。另一种解释是,这些字元符合排版规则,用于防止货币符号与金额或姓名缩写间换行,可能是模型从训练数据中习得的习惯。
OpenAI 此前曾探索过多种水印方案,例如在 2024 年初为 DALL・E 3 影像添加 C2PA 元数据,以及 2025 年 4 月在 GPT-4o 模型上测试可见的 "ImageGen" 标签。
行业内,谷歌的 SynthID、微软的元数据嵌入和 Meta 的强制标签也反映出对内容溯源的重视,但研究显示许多水印技术易受攻击。