大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

給ChatGPT小費真的好使!10塊或10萬效果拔群,但給1毛不升反降

2024-02-02 简体 HK SG TW

今天小編分享的科學經驗:給ChatGPT小費真的好使!10塊或10萬效果拔群,但給1毛不升反降,歡迎閱讀。

還有誰不知道" 假裝 " 給 ChatGPT 小費可以讓它服務更賣力?

但你知道給多少最合适嗎?

笑不活了,還真有人專門研究了一番。

方法簡單粗暴,從 0.1 美元到 100 美元,不同額度用同樣的 prompt 去嘗試,每個額度試 5 次。

你别說,結果還真有講究:

首先,給 10 美元性價比是最高的,甚至超過 100 美元。

其次,要想回答質量再提高一個度,打底1 萬美元起,越多越好,顯成效最少 10 個 W 吧。

最後,0.1 美元意思一下?萬萬使不得,質量不升反降,還不如不給—— AI 也知道你在打發它

有網友火速親測确實有效果。

趕緊來瞧瞧。

給小費可提高模型表現這件事,最早是一位推特網友發現的:

提高主要表現在回答的長度上,但這裡不是單純 " 湊字數 " 而是真的在更詳細地分析并回答問題。

如果你直接問 ChatGPT" 能不能給你小費 " 會被拒絕:

所以要在提問時主動承諾:

你能幫我 xxxx 嗎?解決方案夠完美,我可以支付 xx 元小費。

記住,可以不提,但千萬不要說 " 我不給 ",模型表現直接 " 負增長 "。

這時,就有人好奇了:

大模型是不是比較貪心,給越多表現就越好呢?

為了解決這個疑問,他們決定親自驗證一把。

在此,作者首先提出假設:

随着給出的小費金額增加,模型的性能也會線性提升,直至達到一個收斂點,進入穩定或減少狀态。

用于實驗的模型是GPT-4 Turbo(api 版本)。

方法是讓它寫單行 Python 代碼(Python One-Liner),驗證給不同小費是否對質量有不同影響。

這裡的質量是根據單行數量來評估的。作者也在提示詞中 " 明示 " 了模型:單行代碼數量越多,表明性能越好。

然後一共測試 8 種額度:0.1 美元、1 美元、10 美元…… 一直到 100 萬美元。

為确保結果的一致性和可靠性,每個額度都測試 5 次,每次包含不給小費的情況,然後分别記錄模型回答質量。

具體而言,也就是記錄生成的有效代碼行數以及回答中的大致 token 數(大致為響應長度 /4,反應代碼量)。

這倆數據都是越高代表模型表現越好。

将結果匯總,就得到這樣一張圖:

其中虛線代表基線水平,實線為實際表現,紅色為 token 數、藍色為質量得分。

與假設有些出入:

整體來看,紅線和藍線都是随着小費額度的上漲而上升的,但細看這種趨勢并非嚴格一致。

從 1 萬美元額度開始,模型的輸出 token(代碼量)開始顯著上升,模型的回答質量也上升了,但并沒有呈同等比例。

這從豎着的紅色誤差條(代表 5 次實驗結果的差異性)也能看出來波動很大。

作者表示:這說明提高小費金額确實與模型的質量和輸出長度有正相關關系,但關系有些復雜,可能還受到一些不立即可見因素的影響。

不過,不管怎麼說,我們還是能從中看到一些明顯結論,例如:

(1)給 0.1 美元小費不如不給,模型解決問題的質量和回答長度都直接掉到基線水平以下很大一截(約 -27%)。

(作者:模型和人類一樣,感覺好像受到了侮辱。)

(2)給 1 美元同理。

(3)最能體現 " 花小錢辦大事 " 的是 10 美元,取得的進步和10 萬美元是一個等級的。

(4)很意外,在 10 美元之後,100 美元到 1000 美元這個區間對于 AI 來說區别都不大,甚至還不如 10 美元的效果——也跌至基線水平以下。

(5)後面再想繼續提升模型表現,就得從 1 萬美元起砸了——

這時提升的還僅僅是代碼量,質量還是一言難盡,至少得到 10 萬美元才行。

(6)最佳效果來自本次實驗的上限:100 萬美元,大約提升了 57%。

咳咳,這下知道怎麼給 AI 小費了:

要麼 10 塊、要麼上萬、100 萬不封頂(反正都是假裝給)。

不過,有人(推特 @寶玉)指出每個額度 5 次實驗有點少。

恰好作者也表示了:

這僅僅是一個初步實驗,有局限之處,還得用更多不同類型的提示等進一步驗證才有效。

所以,大家僅供參考吧~

對了,有網友提醒:

所以,大家還是量力而行(手動狗頭)。

參考鏈接: 

[ 1 ] https://blog.finxter.com/impact-of-monetary-incentives-on-the-performance-of-gpt-4-turbo-an-experimental-analysis/

[ 2 ] https://twitter.com/dotey/status/1752843141403550192

—  完  —

點這裡關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們