今天小編分享的科學經驗:AI被自己騙了!生成照騙輕松逃過AI鑑别器法眼,馬斯克機器女友、3米巨人都「成真」了,歡迎閲讀。
以假亂真的 AI 生成式圖片,AI 自己分辨不出來了。
這張馬斯克和機器人女友的照片,5 個鑑别器裏有 2 個都覺得是真的:
還有這張人類和 3 米巨人的合照,居然 5 個鑑别器一致判斷為真:
啊這,AI 鑑别器似乎不太靠譜的亞子。
這就是《紐約時報》最近做的一項測試,他們找來了市面上五個常見的 AI 鑑别器,分别喂給它們 100 多張照片做測試。
結果發現,AI 鑑别器不僅會把 AI 照片錯認成真的,也會把真實照片劃定為 AI 生成的。
而且不同鑑别器之間的水平差距也不小。
具體表現如何?一起來看
加點顆粒(Grain)就能騙過鑑别器
在這項測試中一共使用了 5 個 AI 鑑别器,分别是:
Umm-maybe
Illuminarty
A.I or Not
Hive
Sensity
測試的内容包括 AI 和人類創作的圖片,分别喂給每個鑑别器,看它們會怎樣判斷。
使用的 AI 創作工具包括 Midjourney、Stable Diffusion、Dall-e 等。
《紐約時報》主要展示了這樣幾個例子。包含 5 張 AI 創作的圖片,以及 2 張真人拍的照片。
從統計結果來看,五個鑑别器中只有Hive全部判斷正确。
Umm-maybe 的表現最差,只判斷對了兩張圖。
舉例來看,這張照片是 AI 生成的,聽説還在 2 月的一場攝影比賽中拿下大獎,這道題就難倒了大部分鑑别器。
但這張純 AI 生成的照片,就沒有逃過大部分鑑别器的法眼。
對于人類創作的照片,AI 鑑别器的正确率比較高,兩張照片都只有 Umm-maybe 鑑别器判斷錯誤。
此外他們還專門測試了藝術畫,發現大部分 AI 鑑别器能判斷出這是真人畫的。
對比另一幅 AI 創作的,同樣也是四個鑑别器判斷正确。
(Umm-maybe 啊……是真的不太行)
值得一提的是,如果對 AI 影像進行一些加工處理,AI 鑑别器會失效。
比如這張 Nike 男的照片,一開始有 4 個鑑别器判斷它是 AI 生成的。
但如果給圖片加一些顆粒,AI 鑑别器就會将這張圖片的 AI 含量從 99%,判斷為僅有 3.3%。
最後,我們也測試了一些能上手實測的鑑别器(Umm-maybe、Illuminarty、A.I or Not)。
結果顯示,對于 " 馬斯克在蘇聯 " 這張圖,Umm-maybe 覺得它有 85% 的概率是人類創作的。
Illuminarty 覺得它是 AI 創作的概率僅有 5.4%。
只有 A.I or Not 确定了它是 AI 生成的。
AI 鑑别的判斷标準是啥?
那麼 AI 到底是怎麼鑑别真偽的?
普遍來説,它們和人類的判斷标準不太一樣,人類一般以影像内容的合理性為依據,而 AI 更多是從影像的參數入手,比如像素的排列方式、清晰度、對比度等。
所以這就解釋了開頭那張巨人照片,為啥所有鑑别器都覺得很真。
在 AI 畫畫大火一年多以後,如今市面上已經出現了非常多鑑别器。
有的就是直接放在 Hugging Face 上供大家免費使用,有的則是已經成立公司,只提供 API 接口形式。
比如 Hive 就是一家提供商業解決方案的公司,從如上的測試結果可以看到,Hive 的表現效果也是最好的,幾乎都能判斷正确。
而在這之前他們的主要業務是為平台網站提供數據審核服務,影像視頻文字都支持,服務的平台有 Reddit、Quora 等。
參考鏈接:
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html