今天小編分享的科技經驗:TikTok化身“正義判官”,歡迎閱讀。
出品 | 虎嗅科技組
作者 | 王欣
編輯 | 王一鵬
頭圖 | 視覺中國
繼本周二向美國聯邦法院提起訴訟後,TikTok 再度化身 " 正義判官 "。
本周四,TikTok 宣布将推出自動标記功能,以确保其識别 AI 生成視頻的内容并得到相應标記。
值得注意的是,此前 TikTok、Facebook 和小紅書等社交平台,已經要求用戶主動披露所發布内容是否由 AI 生成。
而 TikTok 最新舉措,旨在識别并自動标記出外部 AI 生成的視頻和影像。(包括使用 Adobe 的 Firefly 工具、TikTok 自己的 AI 影像生成器和 OpenAI 的 Dall-E 制作的内容)
AI 安全公司瑞萊智慧聯合創始人蕭子豪告訴虎嗅,AI 生成影像視頻内容鑑别技術的主流方法有:檢測生物信号、周期性網格信号、違背常識特征等,目前技術在一些場景已經可以達到 95% 到 99% 的檢出率。
有 AI 從業人員觀察到最近的趨勢是,包括 TikTok、OpenAI、Meta 等 AI 大小廠陸續上線 AI 标識相關功能。
這是因為 AI 深度偽造内容正在播下混亂的種子,在社交平台飛速傳播。
這些虛假内容的泛濫,混淆選民視線,讓這個大選年更加成為 " 多事之秋 ",也使得社交媒體面臨識别深度造假和防止錯誤信息傳播的壓力。
AI 深偽内容攪動大選年
今年是選舉歷史進程的重要年份,在全球 50 多個國家和地區,有世界一半人口參與選舉。相較去年,AI 深偽内容也變得更加引人注目和難以辨認,給大選年蒙上陰影。
一月,一名民主黨工作人員深度偽造了美國總統拜登電話呼叫,這則 " 假拜登來電 " 敦促新罕布什爾州初選選民不要去投票站。
冒充拜登的電話呼叫内容為:把你們的選票留在 11 月份再投很重要。在這周二(23 日)投票,只會讓共和黨人得逞,讓特朗普再次當選為共和黨候選人。
在印度,今年有超過 5 億選民将會參與投票,這使得 AI 深偽政治内容成了一門有利可圖的大生意。
AI 内容制作公司在印度政治人士中頗受追捧。這些公司向媒體透露,預計今年印度政黨在 AI 生成的競選材料上的支出将超過 5000 萬美元。
穆奧尼姆公司的創始人森希爾奈亞甘從一月開始為政治家創造 AI 内容。他與泰米爾納德邦執政黨合作,制作了一個 AI 視頻,視頻中該黨已故的标志性領袖 M · 卡魯納尼迪被 " 數字復活 " 并為州政府背書。
AI 内容機構 Avantari Technologies 幾乎每天都收到制作政治人物深偽視頻的請求,出于道德層面的考慮他們拒絕了這些請求。
但這個選舉季,仍有一些政治深偽視頻在印度互聯網開啟了病毒式傳播,比如著名寶萊塢明星阿米爾 · 汗批評莫迪的視頻。
而深偽色情内容也被更多得用在女性政客身上,有專家稱深偽内容的興起,甚至可能會改變競選公職人員的性别比例。
去年,孟加拉反對黨政客魯米恩 · 法爾哈納就經受了這種人格诽謗,社交媒體上出現她穿比基尼的 AI 深偽照片。
在孟加拉國這個穆斯林占多數的保守國家,這張照片在社交媒體上引起了軒然大波,許多選民認為這張照片是真實的。
" 無論出現什麼新事物,它總是首先針對女性。他們在每一起案件中都是受害者," 法爾哈納說, " 人工智能都不例外。"
AI 大廠拿起 " 雷神之錘 "
在全球範圍内,AI 深偽内容不斷增長," 唯一阻止我們制造不道德的深度偽造品的,是我們的道德規範," 相關從業人員告訴媒體。 " 但要阻止這種情況非常困難。"
這是因為包括美國在内的許多國家,并沒有在國家層面針對這些内容采取監管行動。
在缺乏監管的情況下,Adobe、微軟等 20 家科技公司自發達成 " 内容真實性倡議 " ( Content Authenticity Initiative ) 聯盟,以控制深偽内容得擴散。
本周四,TikTok 表示将加入這個聯盟,并計劃開始對 AI 生成影像視頻内容進行标記。該聯盟将在 AI 生成產品中納入内容憑證。
" 我們還制定了禁止未标記的真實人工智能内容的政策。如果真實人工智能(生成的内容)出現在平台上,那麼我們将因違反社區準則而将其删除。"TikTok 運營、信任和安全主管 Adam Presser 表示。
Meta 本月早些時候表示,它将開始檢測谷歌、OpenAI、微軟、Adobe 和 Midjourney 插入的隐形标志物,為 AI 生成的内容打上 "AI 制作水印 "。針對不易識别的 AI 深偽内容,Meta 還表示,它正在開發深度偽造檢測分類器。
在周二,OpenAI 也宣布加入這一聯盟,并将元信息嵌入其影像模型 Dall-E 3 生成的所有影像。OpenAI 還表示,在視頻生成模型 Sora 發布後,會采取相同的措施打上 AI 标識。
蕭子豪告訴虎嗅,OpenAI 的 AI 标識技術,比較成熟的做法是在 AI 生成影像的頭檔案裡添加相關隐藏字元段。
這種做法類似于在 AI 影像内部打上 " 看不見的水印 ",在傳播前就打好了标籤,用戶肉眼不可見。好處是不影響觀感,圖片在上傳到 TikTok、Facebook 等社交平台後可以很容易識别出來并自動标識。
之前較為傳統的在圖片右下角打上 "AI 生成标識 " 外部水印,雖然肉眼可見較為明顯,但是如果通過截圖完全可以去掉外部水印,進行二次傳播。而要抹除 OpenAI 這種内部水印,則需要更為復雜的技術手段。
這種 AIGC 工具的标識方法成本并不高,但由于國外寬松的監管條件,因此除上文提及的大廠外,其他 AIGC 生成工具平台,并沒有大規模針對 AI 内容打上 "AI 水印 "。
技術宅拯救世界
那麼 TikTok 等社交媒體該如何檢測這些沒有提前打上 "AI 水印 " 的虛假視頻和影像呢?
這就涉及到更為復雜的深度偽造檢測分類。
蕭子豪表示,針對這類無标識 AI 内容,目前有兩種主流鑑别路線。
第一條,通過深度學習算法識别内容中違背常識的部分。例如,AI 深偽生成的人物可能有着與常人不同眨眼頻率等生物特征,此外還可以依據光照不一致性、心率等特征判斷。
英特爾實驗室的 Demir 解釋道:" 當你的心髒泵血時,血液流向靜脈,靜脈的顏色會因氧含量而改變。這個顏色變化對我們的眼睛是不可見的;我不能僅憑觀察視頻來看出你的心率。但這種顏色變化在計算上是可見的,從而可以檢測出一個人是真實的還是合成的。"
這種方法需要給模型輸入真實和 AI 生成的内容數據集,并在此基礎上加入與常識有關的規則算法約束。而這種違背常識的視頻,效果并不真實,實際上本身就很容易被人肉眼識别出來。
而對于效果較為逼真、人眼難以識别的 AI 内容,則需要引入第二條鑑别路線——識别對抗模型和擴散模型特有的信号特征。
目前,AI 圖片生成模型應用較多的是對抗模型和擴散模型,而研究發現,它可能會在頻譜上保留周期性網格狀特征。
這部分是由于這種模型用到的卷積神經網絡算法,會重復對整個畫面進行信号處理,因此會保留周期性特征。
目前的趨勢是:随着 AI 深偽内容技術的不斷提高,深偽鑑别技術越發依賴第二種路線,這種路線對團隊的人工智能理論研究和實踐能力要求更高。
而在深偽鑑别的應用落地層面,國内要比國外起步早,技術也并不比國外差。
這是因為:AI 深偽技術主要應用于人臉,而國内的人臉識别應用較多,間接催生了深偽鑑别需求。因此國内深偽鑑别技術業務開展較早,積累也更好。而國外在 OpenAI 引領的 AIGC 浪潮開始後,才開始大規模關注深偽鑑别技術。
蕭子豪告訴虎嗅:深偽鑑别技術需要突破的瓶頸在于算法理論和數據收集。
目前,AIGC 技術的飛速發展,使得 Sora 等新的 AI 生成内容工具和技術持續湧現,在 AI 安全的攻防層面也有了獨特的張力,要求在防御層面要及時追趕最新的攻擊。
因此要及時收集最新深偽技術數據,分析偽造方法的演化,提升偽造分析的能力,來不斷迭代更新產品。
Tips:我是虎嗅科技醫療組的王欣,關注 AI 及創投領網域,行業人士交流可加微信:13206438539,請注明身份。