今天小編分享的科技經驗:AI把表情包都玩明白了,人類連玩梗的快樂也保不住了?,歡迎閱讀。
做表情包一度是很多文生圖、文生視頻應用的場景。Pika 在去年就靠魔法貓,在國外出圈了一把。
然後 Pika 就走上了一條新賽道,開始深耕表情包制作。
雖然有點一言難盡吧,不過也不算脫離常規:都是已有的素材,讓 AI 來實現動态化調整——如果 AI 自己就能做表情包了呢?
瑞典皇家理工大學聯合德國兩所大學最近的一項研究顯示,AI 不僅懂表情包,甚至還能「做」表情包。
出梗不只靠天賦,AI 也可以懂
有一說一,上網衝浪久的都知道,表情包想要真正傳播開來,光靠動效本身是不夠的。動不動态、一不一致,并不是決定性的——對表情包來說,最重要的還是得好笑。
那麼就回到那個經典問題了:人工智能懂什麼是幽默嗎?
研究人員們就好好鑽研了一下這個問題:他們把 AI 和人放在一起,比賽誰能把表情包做得好笑。
在研究中,用到的是相對比較簡單的表情包「公式」:底圖 + 字。比如以下這些經典作品:
這種類型的表情包就是開局一張圖,剩下全靠字。字加好了,才稱得上是表情包,否則就是一個帶字的圖片罷了。
因此也最适合用來檢測 AI「懂不懂幽默」。除了讓 AI 生成,還有一隊人類參與者加入創作作為對照,另外還有一組是和 AI 合作共創,最後再由人來打分。
研究結果裡沒有把所有的表情包都放出來,只選擇了個别案例。從這些案例裡能見到 AI「懂」了,但不太多。再碰上個不太懂玩梗的人類,那差距确實就不太大了。
整體來看,LLM 獨立生成的表情包,在「有趣」「創意性」上的得分,都超過人類作品。唯一例外的是「可分享性」,即是否願意分享和傳播。在這個維度上,AI 生成的表情圖得分并不特别高于人機共創。
能不能刺激分享欲,是表情包很重要的價值,是它能作為互聯網通用語言的核心原因。
同時它最好得是搞笑的。西班牙一所大學的教授,研究了在 2020 年國外面臨大規模封鎖時的表情包分享,結果發現「幽默」,是表情包傳播的核心特征。尤其在疫情期間,幽默能夠緩解恐懼和不确定性。
這些也是為什麼長久以來,喜劇和幽默内容創作,被視為 AI 不可能染指的地盤:大模型既不能和人一起「經歷」點兒什麼,也不會理解「好笑」這種情緒和感覺。矽基生物跟碳基生物,始終是不一樣的。
但是,這并不能阻止 AI 搞抽象。
AI 會搞抽象,但不完全會
去年夏天,南加大就發布過他們的發現:ChatGPT 生成的笑話,已經比人寫的更好笑了。
在實驗中,幾乎有 70% 的參與者認為 ChatGPT 的笑話比普通人寫的更有趣。相比之下,25% 的人更喜歡人類創作的笑話,5% 的人認為兩者一樣有趣。
「幽默」作為一種情緒和感受,或許是矽基生物擁有不了的。但是幽默文本,是可以被拆解和學習的。
2023 年的國際計算創造力大會上,喜劇編劇 Joe Toplyn 發表了他的喜劇内容生成系統 Witscript。
具體來說,這就是通過使用已在電視節目上播出的搞笑内容,做成數據集,再進行微調的預訓練神經網絡語言模型。通過填補 prompt 的空白來完成笑話,返送給用戶,配套還做了一個產品。
免費試用都沒有,上來就要付費,也不知道是不是真的那麼搞笑。
開發者 Joe Toplyn 是職業喜劇編劇,他給各種喜劇、脫口秀節目寫段子,拿過四次艾美獎,并且擔任過兩檔頂級深夜秀的首席編劇。
他認為,能職業化的寫作都是有公式可以套用的,只要數據足夠,大模型也可以學會寫段子。
悉尼大學學報也發過一篇文章認為,通過跟蹤用戶消費數字内容時的行為,比如循環播放視頻的次數、滾動浏覽特定内容的速度,以及我們是否被特定類别的效果和聲音所吸引,算法可以推斷出我們是不是認為某些内容有趣。
甚至,我們在使用「哭笑」這個 emoji,作為對視頻内容的反應時,也是一種強化學習的過程。
壞就壞在,即便大模型真的可以寫段子,觀眾可能并不喜歡。
呼蘭在一檔綜藝節目上,現場讓 AI 寫了一個脫口秀段子,要求跟人工智能相關,要「好笑,幽默,非常好笑」。
結果就是一點都不好笑 …… 如果不是由呼蘭讀出這些段子,那更加是毫無任何效果可言。
喜劇效果很大程度上依賴于脫口秀的表達方式,僅僅是作為文字時,段子的魅力會大大流失。就算 AI 掌握了喜劇寫作的方式,但那也只是幽默的一小部分。
歸根到底,幽默是一個成分非常復雜的東西:一個人的笑點,很大程度上受到所處的文化、社會的影響。這也是為什麼在外國人大量湧入小紅書時,首先要學的是怎麼各個表情包的使用。
如果用不明白這些表情包,上小紅書衝浪的樂趣就大大減少。可是要弄懂這些表情包,就要理解背後的文化含義,不然就會出現下面的情況:
那更别提還沒有深度參與人類生活的 AI 了。在這次實驗中,人類創作的表情包在幽默性上,表現是最好的。
人機協作可以有效提高產出的數量,但并不一定就能提高質量。
從根本上講,沒有一個表情包是孤島。在表情包裡,不僅可以看到網友們在「網絡」這個公共場合表達自己的方式,還可以看到一些共有的主題,比如焦慮或者人生煩惱,所有這些復雜的問題都能反映在一個簡單的表情包裡面。
大多數成功的表情包,尤其是傳播範圍廣的,都具有這些關鍵屬性。比如某一段時間内流行的,通常是公眾記憶中最近發生的事情。
盡管一些大模型應用,數據好訓練好,确實可以寫出跟人類不相上下的段子。但它們始終無法捕捉不同情境下,人類幽默的深度和多樣性——共同的經驗和記憶,才最能引發共鳴。