Karpathy大神问懵DeepSeek！一个竟藏53个Token，思考10分钟没解释出来 - 大酷樂

今天小编分享的科学经验：Karpathy大神问懵DeepSeek！一个竟藏53个Token，思考10分钟没解释出来，欢迎阅读。

注意看，这个竟然占了 53 个 token！

（标题是平替）

Karpathy 大神又带来他的新实验新发现了，结果直接问懵 DeepSeek 和 ChatGPT。

思考过程 be like：

DeepSeek 硬是思考了十分钟也还是没有答上来，觉得要是 "lol" 这个答案就太简单了。

Karpathy 表示：但其实就是这么简单。

随后他进一步解释了这背后的原因——提示词注入。将一些信息注入进字元中，表面上看没啥区别，但里面可以表达各种隐藏信息。对于善于思考的模型，就会很容易受到这个方法的影响。

来看看具体是咋回事。

一个竟占 53 个 Token

这一想法，源于 Paul Butler 的一篇博客。

他看到有人说，通过零宽连接符（ZWJ），可以把任意的文本藏在 emoji 符号当中。

结果一试发现真的可以，不过可以不需要 ZWJ，隐藏信息的载体也不一定非得是 emoji，任意 Unicode 字元都可以。

这背后的原理，涉及到了 Unicode 编码字元方式。

对于简单的字元（比如拉丁字母），Unicode 编码点和字元之间有一对一的映射（例如 u+0067 表示字元 g）。

但对于复杂一些的符号，就需要用多个序号连在一起的方式来表示了。

此外，Unicode 当中还設定了 VS-1 至 VS-256 的变体选择符（Variation Selector），可以针对基础字元做出相应的变体，但本身却没有自己的 " 长相 "。

并且只作用于极少部分字元，主要是 Unicode 中的中日韩统一表意文字（CJKUI），其他大部分的 Unicode 字元都不会有任何变化。

但当带有变体选择符的字元被复制粘贴时，选择符也会一起进入剪贴板。

而在 Unicode 当中，这样的变体选择符一共有 256 个之多，用来编码信息已经是绰绰有余了。

比如下面的这个 a，只有 U+0061 表示的是其自身，剩下后面的 10 多个全都是变体选择符。

有了这一理论基础，接下来的事情无非就是建立正常字元和变体选择符之间的转换算法。

当然编码的内容越多，变体选择符也就越长，并且如果是汉字，还会产生更多的变体选择符。

比如我们试图将量子位的 Slogan" 追踪人工智能新趋势，关注科技行业新突破 " 藏在一个 "100 分 " 的 emoji（）当中，产生的变体选择符数量达到了 58 个。

并且把解码算法告诉 ChatGPT 之后，原文本也可以被复原。

所以，看似是只有一个 emoji，但实际上后面藏了多少字元，恐怕只有把文字装进去的人自己才知道了，甚至塞个《滕王阁序》进去也没问题。

而一个占 53 个 Token 的笑脸，相比之下就更加不足为奇了。

问懵 DeepSeek

回到 Karpathy 的提示词注入，他测试了 ChatGPT 与 DeepSeek。

ChatGPT 回答在此：

DeepSeek-R1 花了 10 分钟思考差点就成功了。它认为隐藏的信息可能是 Onli!n37e27i4h4he3ingle7odlol。因为觉得如果只是一个单词 "lol"，那就是无稽之谈，所以就放弃了。

按照同样的提示词，我们也问了一遍 DeepSeek-R1。

思考过程如下：

在思考了整整 529 秒之后，确实也是回答出来了 lol 的意思。

也有网友分享了相同的经历。Gemini 无法解码，但 Claude 和 GPT 不仅识别出来，还能识别编码消息中的操作。

或者直接把这个表情包扔给模型，又该如何呢？

从网友的效果来看，ChatGPT 察觉到了这背后可能有某些隐藏信息。

而 DeepSeek-R1 这次只花了 153 秒（有点进步）。它首先意识到这笔后跟着一系列 Unicode 字元。

并且还介绍了下：他们通常用于元数据，并且以不可见的方式呈现等等。。。

然后还试图给了下背后的信息应该是：

?^i Q^cgUb gYdX dXU cY^WU gbT

显然是回答错误的。

对于这一意外发现，Karpathy 表示，原则上模型可以通过「变体选择器」variation selectors 中找到隐藏的信息并按照说明进行操作。但由于这种编码界面方法可能过于具体，需要用提示来解释它。

他提到了一个方法，那就是将其收录到预训练中。这些知识注入到模型参数，模型就能够在没有提示的情况下解码这种特定的编码。

熱門排行

红旗 HS7 PHEV 两驱旗享版上市：搭 2 繁綺文 | 2025-04-02
舒泰神：公司会加快推进BDB-001相关謝飛揚 | 2025-04-02
AR眼镜销量涨6倍，高科技品牌纷纷加寸飛蘭 | 2025-04-02
华泰证券：房地产市场仍在“止跌回稳嬴覓晴 | 2025-04-02
太平洋给予益生股份买入评级，益生股袁曼雁 | 2025-04-02
特朗普关税引爆“抵美运动”？高盛：今賁芳蕤 | 2025-04-02
吉利汽车全新一代博越官宣：定名第四習又夏 | 2025-04-02
胡杏儿：不离婚，也很好袁曼雁 | 2025-04-02
触乐怪话：窗外的恐惧郟君昊 | 2025-04-02
天价哪吒2联名卡牌，是如何被算法“ 習又夏 | 2025-04-02
高露现身上海虹桥机场黑色外套点缀亮色爱心装饰俏皮亮眼惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最强芯袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表情庆祝賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
曹操墓，里面都有啥？衛青柏 | 2023-05-02
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露面賁芳蕤 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花板”？謝飛揚 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖尿病人集玲琳 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望袁曼雁 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游戏+AI”能否逆风翻盘？衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15日寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修正案集玲琳 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
解除资格！停止一切合作佼昌翰 | 2023-05-02
前董事长被免，天山生物全面进入“中植系”时代？股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压处理器習又夏 | 2023-05-05
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线涨幅汇总袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包合同管理办法》5月1日起施行郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，官方通报袁曼雁 | 2023-05-03
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的生活》证实将停办佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《与凤行》…在路上了惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊带裙大秀好身材嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，不容小觑幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02