今天小編分享的科技經驗:谷歌 DeepMind 開源 SynthID Text 工具,可辨别 AI 生成的文字,歡迎閲讀。
IT 之家 10 月 27 日消息,谷歌 DeepMind 于 10 月 23 日宣布正式開源旗下 SynthID Text 文本水印工具,供開發者和企業免費使用。
谷歌在 2023 年 8 月推出了 SynthID 工具,該工具具備創建 AI 内容水印(聲明該作品由 AI 打造)和識别 AI 生成内容的能力。它可以在不損害原始内容的前提下,将數字水印直接嵌入由 AI 生成的影像、聲音、文本和視頻中,同時也能掃描這些内容已有的數字水印,以辨識它們是否由 AI 生成,不過本次谷歌開源的僅為針對文本生成的 SynthID Text。
▲ SynthID 工具會告訴你影像是人工智能生成的可能性有多大
谷歌介紹,大模型主要通過預測形式生成文本,一次生成一個 Token,這個 Token 可能是一個字元、一個單詞或段落的一部分,為了讓文本更為連貫,模型會在輸出内容時預測下一個最可能生成的 Token,這些預測基于先前的文本。
例如,當大模型要生成 " 最推薦的平台是什麼 " 時,可能會生成 "IT 之家 "、" 友商 1"、" 友商 2" 等 Token,每個 Token 都會獲得一個概率分數。只要有多個不同的 Token 可供選擇,SynthID 就會在不影響輸出質量和準确性的情況下,微調每個 Token 的概率分數,也就是工具通過計算全文中特定 Token 的特定概率,以判斷相關内容是否由 AI 生成。
目前,這一 SynthID Text 水印技術的論文已于《Nature》期刊上發表,并通過整合入 Google Responsible Generative AI Toolkit 的形式開源。谷歌同時提到他們已在 Gemini AI 輸出的内容中整合了 SynthID Text 技術。