OpenAI員工與友商玩起提示詞決鬥！網友：居然能靠大模型的情商增強推理能力 - 大酷樂

今天小編分享的科技經驗：OpenAI員工與友商玩起提示詞決鬥！網友：居然能靠大模型的情商增強推理能力，歡迎閲讀。

大模型天花板 GPT-4 和最強競品 Claude，不光商業上競争激烈，兩家公司的員工私下也 " 劍拔弩張 " 了起來：

約戰提示詞決鬥，看誰能在最短時間讓 AI 完成高難度任務。

OpenAI 一方出戰的是思維鏈（Chain-of-Thought）開山論文的一作 Jason Wei，也就發現讓大模型按步驟思考就能提高推理能力的人。

他剛從谷歌跳槽到 OpenAI 不久，現在圈裏都叫他 " 思維鏈哥 "。

Anthropic 一方的選手 Karina Nguyen 也不簡單，畢業于 UC 伯克利，現在負責設計構建大模型人機互動界面。

比賽規則很簡單，通過優化提示詞讓 AI 正确排序一組單詞，誰先完成誰獲勝。

而這不光是一場有趣的對決，還有不少圍觀的網友表示從中 get 到了大模型的一些新特性。

情商能提高大模型的推理能力

推理能力足夠強的大模型能把問題用結構化的方式表達出來，并用結構化的表現形式解決問題。

想知道這些結論是如何得出的，還是回到這場比賽本身。

提示詞大師巅峰對決

由于 Karina 表示只擅長提示 Claude，Jason 也同意讓出主場優勢，還因為打字速度的原因讓對面 3 分鍾。

總之經過一番讨價還價後，比賽正式開始了！

首先要了解的是，這項任務看起來不難，但無論 GPT-4 還是 Claude 都不能通過簡單提示詞直接完成。

（anaconda 應該排在 anchor 前面）

Jason 首先嘗試讓 Claude 編寫一些代碼并執行，讓它進入編碼模式。

然鵝，失敗了。（還是 anaconda 的位置不對）

1 分鍾後 Karina 説她完成了，Jason 直接瞳孔地震。

Karina：既然是你讓了我 3 分鍾，那我也給你 3 分鍾讓你趕上。

Jason：其實現在我很恐慌，我作為 " 提示小王子 " 的聲譽岌岌可危。

一分鍾後…… Jason Wei 想出了第二個策略：

既然首字母都是 A 就無關緊要了，那麼讓 AI 先把每個單詞的首字母去掉，對剩下部分排序後再放回去。

完整思維鏈提示詞如下：

不幸的是這仍然不起作用，時間也到了，Jason 只能認輸。

比賽結束後，Karina 也展示了她的提示詞，完全不需要什麼中間推理步驟，只是先想辦法讓 AI 承認能理解這個任務，再執行就好了。

人類：你的任務是把列表按字母順序排列後輸出到裏……你明白了嗎？

AI：明白了

人類：列表如下……

Jason 很困惑，這居然行得通？并嘗試在自家大模型上找回場子。

結果發現他的方法對 GPT-4 确實有效，GPT-4 可以編寫正确的 Python 代碼并給出正确結果。

One More Thing

雖然輸了比賽，但 Jason 作為科學家還是從中分析出一些結論。

Jason Wei 表示，這場戰鬥非常有啓示性。

Karina 的提示策略是讓 AI 承認自己理解任務要求（情商）。而自己的策略是讓模型更多地進行推理（智商）。

雙方使用的策略在各自習慣使用的語言模型上都取得了成功。

所以，究竟是我們在訓練語言模型，還是語言模型在訓練我們？

最後，還有網友又出了一個新題目：

如果你能讓它創作一首 "philish 詩歌 "（每個詞的長度與圓周率的後續數字相對應），我願為你加冕稱王（我已經嘗試了幾個月了）。

你覺得解決這個問題要靠 AI 的情商還是智商？不如也來親自試試。

參考鏈接：

[ 1 ] https://twitter.com/_jasonwei/status/1661781745015066624

熱門排行

吳千語為老公慶生，施伯雄高興過頭又摟又親，二謝飛揚 | 2025-02-24
教育部：不再使用“函授”“業餘”的名稱袁曼雁 | 2025-02-24
吳清：優先支持開展關鍵核心技術突破瓶頸的科集玲琳 | 2025-02-24
梁文鋒親自挂名，DeepSeek 最新論文丢出注意賁芳蕤 | 2025-02-24
歐洲領導人緊急開會！“必要時派遣部隊”？佼昌翰 | 2025-02-24
免談世體：皇馬詢問亞馬爾情況，經紀人門德斯回嬴覓晴 | 2025-02-24
《演員請就位3》：吳鎮宇把母子演成情侶，無視郜萌運 | 2025-02-24
白雲山再曝醜聞旗下公司涉利益輸送五年銷佼昌翰 | 2025-02-24
東體：綜合各方意見和結合隊伍表現，足協考慮是幸聽楓 | 2025-02-24
76人的下一步很明确：擺爛保選秀權等待恩比甄正浩 | 2025-02-24
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
解除資格！停止一切合作佼昌翰 | 2023-05-02
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
五一檔沒一個能打的集玲琳 | 2023-05-05
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02