今天小編分享的科技經驗:OpenAI o3 / o4-mini 模型AI生成文本含特殊符号,推測為隐形水印,歡迎閱讀。
IT 之家 4 月 22 日消息,AI 初創公司 Rumi 發現 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不換行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字元。
IT 之家注:這些字元在普通視圖中與标準空格無異,但在 SoSciSurvey 或 Sublime Text 等專業工具中,可檢測其獨特代碼。
Rumi 表示在 GPT-4o 等 OpenAI 此前模型中,并不存在這些設定,這些選項可以通過簡單的 " 查找替換 " 移除,推測這可能是 OpenAI 故意設定的水印。
Rumi 強調,這種字元檢測方法誤報率極低,但易被繞過的缺陷明顯。另一種解釋是,這些字元符合排版規則,用于防止貨币符号與金額或姓名縮寫間換行,可能是模型從訓練數據中習得的習慣。
OpenAI 此前曾探索過多種水印方案,例如在 2024 年初為 DALL・E 3 影像添加 C2PA 元數據,以及 2025 年 4 月在 GPT-4o 模型上測試可見的 "ImageGen" 标籤。
行業内,谷歌的 SynthID、微軟的元數據嵌入和 Meta 的強制标籤也反映出對内容溯源的重視,但研究顯示許多水印技術易受攻擊。