今天小編分享的科技經驗:本想用AI來打敗AI,結果不小心翻車了。。。,歡迎閱讀。
不久前,一張馬斯克嬰兒時期的照片在外網被瘋狂轉發。
起因是一名博主在推特上發了張圖,并配文 " 據報道,埃隆 · 馬斯克正在研究一種抗衰老配方,但結果失控了。 "
你别說,這照片乍一看,還真挺容易被唬過去的。
但只要稍微用心辨别,就能看出來這是成年馬斯克的臉直接移植上去的, AI 味兒太衝了。
自打這 AI 大模型成熟以後,各種 AI 生成的内容就在網絡上迅速泛濫。
像什麼川建國同志退休後的生活;
還有 " 馬斯克投資 AI 失敗,賣燒烤還債 "" 馬斯克在廣州城中村擺攤的日子 "" 馬斯克 kiss 女機器人 " 。
各種梗圖層出不窮,開局一張圖,内容全靠編的情況是愈演愈烈。
而在文本領網域,不少學生借着 AI 寫論文、寫作業,甚至于莫言也坦言,給餘華的頒獎詞是 ChatGPT 幫忙寫的。
那麼問題來了, AI 生成的内容滿天飛,我們要怎麼去區分到底哪些是 AI 創作的,哪些是人類創作的呢?
前段時間 AI 詐騙 430 萬的案子大家都還心有餘悸,再這麼任由 AI" 狂飙 " 下去,下一個受害者可能很快就會出現。
其實吧,現在市面上也出現了不少反 AI 工具,專門用來檢測 AI 生成的内容。
不過,這些工具真的就靠譜嗎?
為此,世超專門找了幾個檢測工具,測試了一波。
首先是 AI 影像檢測。
世超分别找了 Umm-maybe 、 Illuminarty 、 AI or Not 這三個讨論度比較高、甚至是号稱準确率在 95% 的檢測工具,方便做一個對比。其中 Illuminarty 和 Umm-maybe 測試結果顯示的是概率, AI or Not 則是直接給回答。
本以為 AI 檢測工具是個 " 火眼金睛 " ,但沒想到在馬斯克 " 返老還童 " 的那張圖片上,就開始翻車了。
Illuminarty 和 AI or Not 的态度都很明确,這明顯就是由 AI 生成的。
但輪到 Umm-maybe ,畫風就變了。
它告訴我,這張圖片是人類創作的概率為 81% 。
我尋思這肉眼都能瞧出來是 AI 幹的好事,這怎麼還能檢測不出來呢。
為了看看是不是偶爾的 bug ,我又多試了幾次。
這張奧黛麗赫本在《 羅馬假日 》裡的電影截圖, Umm-maybe 給了個模棱兩可的答案,概率是一半一半。
剩下的一個站 AI ,一個站人類。
至少從馬斯克和赫本這兩張圖片的測試結果來看,除了 AI or Not 之外,其他兩個 AI 檢測工具的判定都不太準确。
不過,打臉的時刻總是來得很快。
當我以為 AI or Not 稍微靠點兒譜的時候,它卻說這張金角大王拿着漢堡的 AI 圖片,是人類生成的。
你以為這就完了?更離譜的還在後頭。
這張梅西踩縫紉機的 AI 照片, Umm-maybe 給出的人類創作概率為 89% 。
這有點過于荒謬了。。。
還有這張人跟巨型老虎合影的照片,肉眼就能看出來是 AI 生成的吧。
結果除了 Umm-maybe ,其餘都認為這是人類創作的,甚至 Illuminarty 還覺得 AI 生成的概率只有 1.5% 。
總結一下,在 AI 圖片的檢測上,世超總共測試了 10 張不同的圖片, 8 張由 AI 生成, 2 張由人類創作。
排除掉了 2 項有争議的結果後, AI or Not 和 Umm-maybe 的準确率都是 67% ,而 Illuminarty 的準确率為 50% 。
也就是說,這三個 AI 影像檢測工具的準确度并不算高。
咱們再來看看文本的檢測情況。
同樣,還是選用了 3 個比較熱門的檢測工具:GPTZero 、 Sapling 以及 Copyleaks 。
世超先讓 ChatGPT 生成了一段關于椰汁的廣告文案,再依次用工具進行測試。
但一上來就給我整不會了。
我原封不動從 ChatGPT 那邊粘貼過來的文案, GPTZero 竟然說是可能完全由人類編寫。
而 Sapling 給出結果也一樣,這段文字由 AI 生成的概率為 0 。
只有 Copyleaks ,把全文都标紅了,咬死這是 AI 寫的。
三個工具裡有兩個都檢測不出來這是 ChatGPT 寫的,是不是有點太過分了。。。
不信邪的我,又讓 ChatGPT 以魯迅的風格寫了一篇《 火鍋日記 》。
Copyleaks 依舊穩定發揮, GPTZero 這回倒是學聰明了,只有 Sapling 還在死死堅持那就是人寫的。
為了測試這些工具對于人類創作的反應,我又節選了一段《 活着 》裡的内容。
可能是餘華老師的《 活着 》過于出名,幾個工具在這一關上倒是沒有踩坑。
前前後後測試了好幾次,除了 Copyleaks 的正确率相對比較高之外,剩下的感覺都不是特别聰明的樣子,而且 Sapling 還出現了對中文不太友好的情況。
其實吧,無論是影像還是文字檢測,都是靠着 AI 把人類創作和機器生成區分出來。
換句話說,就是用魔法來打敗魔法。
只是不同的訓練模型,所用的數據集不同,分類的指标也不同。
不過,這次的測試結果大家應該也看到了, AI 檢測工具的效果并沒有想象中那麼好。
世超覺得問題,可能就出在這訓練數據上。
像上文提到的 AI or Not ,它的數據集範圍就只有 Stable Diffusion 、 Midjourney 、 Dall-E 、 GAN 和 Generated faces 生成的影像,如果超出了這個範圍,誤判也是常有的事兒。
雖然可以利用視覺算法,将輸入影像的分辨率、清晰度等局部細節跟 AI 影像的特征進行比對。
但攔不住 AI 進化的速度太快了,像之前備受吐槽的 " 六指戰士 "Midjourney 每更新一版,對于細節的刻畫也就更逼真。
這文本呢,也是類似的情況。
就比如說這 GPTZero ,要想知道文字到底是不是由 AI 生成的,需要看兩個指标,一個叫困惑度,一個叫突發性。
困惑度指的是 AI 模型在看到這段文字時,會不會覺得很難懂,像什麼 " 依托答辯 " 之類的諧音梗, AI 不一定能夠看懂,困惑度越高,就證明内容越有可能是人類創作的。
而突發性,指的就是句子結構的變化程度。
畢竟人類跟 AI 不同,在寫東西的時候句式可能一會兒長一會兒短,追求的就是一個變化多端, AI 則更傾向于使用統一的句式。
但 AI 在不斷的進化中,無論是在困惑性還是突發性上,生成的内容越來越接近人類。
更何況現在的 AI 大模型一天一個樣,等 AI 檢測追上來, AI 生成的内容早不知道飙到哪去了。
但凡人類有什麼風吹草動, AI 就馬上能内化到自己的模型裡。
照這麼下去, AI 生成的東西只會越來越難以辨别。
所以眼下,咱們能做的就是寄希望于技術大牛們,趕緊想辦法讓 AI 檢測工具實現 " 彎道超車 " 。
而這場由 AI 掀起的風浪,終究或許也只有 AI 知道怎麼去平息了。
>