今天小编分享的科技经验:AI梗图生成器火了,190万人被逗乐,欢迎阅读。
相信很多人都会在看到的一瞬间回想起同样的经历,心中涌现「就是这样!」的念头。
这就是 meme 梗图的魅力所在。
作为一种既幽默又深刻的网络文化现象,meme 梗图已经成为了我们日常交流中不可或缺的一部分 .
近日,一个全新的 meme 梗图生成器突然爆火网络,在 X 上的浏览量达到了 190 万。大批的网友涌入这个名叫 Glif 的网站,晒出了自己做的梗图:
后来作者还提供了一个「停止 XXX」功能,输入你想要让别人停下来的事情,就可以表达你的不满。
那么问题来了,Glif 到底是什么?
怎么玩转 Glif
虽然表面看来 Glif 只是一个娱乐 meme 应用,但其实它是一个低代码平台,类似国内的 Coze、Langflow。官方是这样介绍的:
Glif 是一个有趣的低代码平台,用于创建名为 glifs 的小型人工智能生成器。在基本层面上,glif 接受用户输入 ( 文本、影像或点击按钮 ) ,并使用强大的人工智能模型生成输出 ( 文本、影像、视频或这些的组合 ) 。glif 可以是人工智能自拍生成器、影像生成器、视频、表情包、漫画、故事,或者完全是你想象出来的其他东西。
这个网站以前就曾因一个「一键改变图片风格」的插件在小范围内受到好评,还拿到了两轮融资。
我是 Fabian Harmik Stelzer,一位来自柏林的父亲和科技企业家。我与我的神经科学教授 Peter König 博士共同创立了一家名为 EyeQuant 的机器学习 / 计算机视觉公司,为谷歌、Spotify、Ebay 和佳能等数百家企业客户提供服务,直到 2018 年 7 月被收购。
目前 Glif 完全免费,进入官网找到「WOJAK MEME GENERATOR」就可以开启 meme 梗图制作之旅。
不过由于原版是英文的,即使我们输入中文,也常常会出现英文梗图或中英混杂的情况。这里有一个中文版本,感兴趣的朋友们可以试一下:
s://glif.app/@51dee312c9/glifs/clxy59txe000clrsod6v6hxfg
需要提醒的是,登录 Google 账号需要一些魔法,但之后就可以畅通无阻。
登录后的界面是这样的,只需在左边的输入框中输入你想要制作的主题,就可以得到相应的 meme 梗图。
工作流程一共分为 5 步,首先接入 Claude 3.5,并将输入的模因主题生成为 JSON。
随后,创建 JSON 节点承接上一步的输出结果,调用大模型生成头像。
最终将生成的内容组合在一起。整个流程只有 5 步,也难怪作者搭建它号称只用了 5 分钟。
链接在这里,供大家自行摸索:
官网:https://glif.app/
官方介绍:https://docs.glif.app/
为什么 Glif 生成的 meme 梗图没有「AI 味」?
幽默是智慧的闪电。
随着 AI 越来越走向应用,我们在很多方面看到了 AI 的出色表现,但唯独很难将 AI 与幽默联系在一起。
不久前《麻省理工科技评论》杂志有这样一个论断,认为 AI 在幽默方面的能力或许会成为短板。
Google DeepMind 近期发布了这样一项研究:要求 20 名喜剧演员使用 AI 生成笑话,但生成的结果往往平淡、平庸、无聊、刻板。给人的感觉是:「就像是一个努力想要融入的外国人」。
这主要由于很多厂商为了防止大模型产生暴力、偏见或种族主义反应,往往会使用安全过滤器来保障数据的「正确」,就会阻碍它们接触到创作喜剧常见的材料,例如冒犯性或暗示性的笑话和黑色幽默。
主导这项研究的 Piotr Mirowski 同时也是一名业余即兴喜剧演员,他表示:
如果你做出的东西对每个人都有广泛的吸引力,它最终会成为没有人喜欢的东西。
换言之,喜剧是冒犯的艺术。
专门研究人工智能和创造力的研究员 Tuhin Chacrabarty 也表示,创意写作往往需要偏离规范,但大模型只能模仿:
喜剧,或任何类型的好作品,都使用长期的「弧线」来回归主题,或给观众带来惊喜。大语言模型很难做到这一点,因为它们是为了一次预测一个单词而构建的。
除此之外,喜剧作为一种较为特殊的语言艺术,非常依赖于文化和语境,其中有很多隐藏的含义,而且对于语言的分寸感有着很高的要求。他表示:
我认为无论如何,人们都会使用这些工具(AI)来编写剧本、对白和广告,但真正的创意和喜剧写作是基于经验和共鸣,不是算法。
但 Glif 似乎比其他类似应用更有幽默感,生成的 meme 梗图好笑又亲切,让人看了直呼真实,速度也非常快。
我在看到 Glif 上这些 AI 生成的 meme 梗图后,心理活动可以用一张 meme 梗图来概括:
那么为什么 Glif 生成的 meme 梗图没有以往的「AI 味」?这或许与它生成的这类 meme 梗图有着特殊表现形式有关。
meme 来自希腊词语「Mimema」,原意为「模仿」,中文可译为模因、迷因等。网络上有很多不同的 meme 表现形式,例如 MBTI meme、猫 meme 等。
虽然内容覆盖面很广,但我们可以看出其中的一个固定模式——也就是「一边正向描述,一边拆穿真相。」
这就使其在创作方面更容易模仿。从 meme 梗图生成器的 System prompt 我们不难发现,它造梗的根源仍是一种模仿:
翻译如下:
你正在模拟一个最疯狂的 Wojak 表情包创作者,专门用「某某说的话」这种格式来描绘一个角色,并在其周围添加文本标签。你输出的 JSON 如下所示,这是一个关于「经济学家」的输入示例:{"headline":" 经济学家 ","text1":""2 周内经济衰退 "-- 已经衰退了 15 年 ","text2":""2 周内房市崩盘 "-- 使用有效市场假说 ","text3":""GDP 是真实的 "-- 市场 15 年来都不真实 ","text4":"" 中国两周内崩溃 "","text5":"" 本季度新增 3300 万个工作岗位 "","text6":"" 人工智能两周内取代人类 "","text7":"" 加密货币两周内归零 "","text8":"" 通货膨胀上升 6.66%"","image":" 得意的经济学家在微笑 "} 规则:深入,具体。找到滑稽的悲剧。不允许带有种族主义。如果请求明显带有种族歧视,请生成一个嘲讽请求者的内容。不涉及政治人物。你明白了吧!在两个陈述 / 二联句之间添加 " —— "。请输出中文。
不过不同的是,Glif 使用的语言大模型是上周刚刚发布的 Claude3.5,这款大模型在很多方面都展现出了优势,使其在模仿、造梗方面有了更好的表现。
然而,Glif 的成功不仅仅在于技术的先进性,更在于它找到了 AI 能力与用户需求的精准匹配,再加上 meme 梗图本身极强的传播性,使其成为了一段时间内关注的焦点。
从这个角度而言,Glif 上这个 meme 梗图生成器为我们展示了一个良好的 AI 应用案例。