大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 财經

從信息論的視角,重新認識這個世界

2024-12-31 简体 HK SG TW

今天小編分享的财經經驗:從信息論的視角,重新認識這個世界,歡迎閱讀。

本文來自微信公眾号:阿茶的 AI 之路,作者:起名賊費勁的阿茶,題圖來自:AI 生成

那天中午,我在知乎上看到一個有趣的問題:

把一篇英語文章的所有 aeiou 替換成 t,它還有可能被完全破譯嗎?

我翻閱了許多回答,有的列舉了 tt、ttt、tttt... 這樣的例子、有的則一本正經地胡說八道、還有人幹脆把問題丢給大模型解決 ....

我覺得這本質上是一個信息論的問題。當我們把所有元音替換成 't' 後,剩餘的信息是否足夠支撐我們還原原文?英語本身就有很高的冗餘性,比如語法結構、詞語搭配等都能提供大量上下文信息。因此,在長文本中,這種還原應該是可行的。關鍵在于,這種替換究竟損失了多少有效信息,剩下的部分是否還足以支撐我們的理解和還原。

說到信息論,我與它的聯系大概是大學選過的一門課,叫《多媒體技術》。選課之前,我天真地以為這門課會教我如何用 PS,如何剪視頻,如何做 PPT。因為從小就在說的 " 多媒體教育 ",感覺就是通過 ppt 來上課。還有 " 多媒體教室 ",就是多了個投影,所以我一直以為這就是 " 多媒體 "。我選它的原因也很簡單,我真的不會用 PS,我想學學。而且這門課應該比較簡單。

上課之後:奈奎斯特定理、信息熵、zigzag、JPEG 影像壓縮原理 ...

我以為的課設:剪一個視頻。

實際上的課設:

就這麼一門和我想象大相徑庭的課,我現在卻覺得是我學過最有用的一門課。因為 " 信息 " 無處不在。你看的新聞是信息,你與他人的交流是信息,甚至你設計的產品界面也在給用戶傳遞信息。

尤其是在當下,信息生產的成本急劇降低,各種公眾号 ... 一個事件可能會被上百個号重復報道。此外,AI 領網域的進展也是日新月異。相比之下,我們就像大海中的小船,随時可能被信息淹沒。接受吧,腦子好像又處理不過來;不接受吧,又怕錯過了什麼。而信息論,正是幫助我們找到理解這些信息的角度,以及制定獲取信息策略的工具。

說遠了,我去簡單復習了一下信息論的基礎知識,也分享給大家。

從生活中理解信息

最開始寫這篇文章的時候,我從定義和公式的角度介紹信息、信息熵、自信息這些概念 ... 但發現太專業了,不适合閱讀。所以我打算放棄那些專業的知識,從一個簡單的遊戲理解信息論。這種直觀理解對于非專業人士來說更為重要。

首先,信息是消除不确定性的。

假設我心裡想了一個 1 到 100 的數字,請你來猜。在沒有任何提示的情況下,這就是一個完全不确定的系統 —— 每個數字的可能性都是相等的。

如果我告訴你:" 今天天氣不錯,我覺得等會我們可以出去玩,順便去吃個火鍋 "。

這句話你會發現對你猜測毫無作用。

而如果我告訴你:" 這個數字大于 50"。你的猜測範圍就減少了一半,然後你猜了個 75。

我繼續說:" 這個數字的範圍在 60-70 之間 "。你的猜測範圍進一步縮小,你猜了個 63。

我說:" 猜對了!"

通過這個簡單的遊戲,我們就能理解信息論中的幾個核心概念:

首先,根據信息論中的定義,信息是用來消除不确定性的。你試圖猜我心中想的數字,通過不斷的嘗試,來降低這個不确定性。直到你猜到我所想的。

自信息:單個事件發生時帶來的信息量。這裡的事件指的是我給你的提示。其中 " 這個數字是 73" 這個事件的自信息就很大,因為它的發生概率很小(1/100)。

信息熵:系統的平均不确定性,當你完全不知道我内心所想的時候,信息熵達到最大。

信息增益:獲得這個信息後,系統不确定性減少的程度。它實際上是信息熵的變化量:原來的信息熵 減去獲得信息後的信息熵。在這個對話中,"60-70 之間 " 能帶來的信息增益一定大于 " 大于 50",因為它幫你排除了更多的幹擾。你只需要在 10 個數裡面選一個。而不是 50 個數。如果我直接告訴你這個數字是 63,那麼它會将整個遊戲的信息熵降為 0。因為你已經不需要猜了。

這就是信息的本質:消除不确定性。當你獲得的有效信息越多,系統的信息熵就越小,你就越接近信源。

再舉個生活中的例子。當你在考慮是否購買一件商品時,每條信息都在幫你消除不确定性:

" 這是一件純棉 T 恤 "(确定了品類和材質)

" 價格 299 元 "(确定了價格區間)

" 隔壁店同款 199 元 "(這個信息增益很大,可能直接影響你的決策)

很明顯,這些概念不僅存在于理論中,更與我們的日常生活密切相關。每當我們需要做決策時,都在不斷地收集信息,評估信息的價值,通過獲取高信息增益的内容來幫助我們作出更好的選擇。希望這兩個例子能夠讓你有一個直觀的印象。

現在我們再來看看開頭的問題,用剛學到的信息論概念來分析一下。當我們把所有元音都替換成 't' 時,表面上看是損失了一些信息。但英語文本中其實存在大量的 " 信息冗餘 "。比如語法結構(主謂賓的位置)、單詞搭配(即使 "make a decision" 中的元音被替換,我們也大概能猜出來),以及整句話的語境,這些都在幫我們消除不确定性。即使失去了元音信息,其他信息的存在依然能幫助我們很大程度推測出原文。當然,這說的是大部分場景,信息越多,能還原成功的概率越高。

信息論給我們的啟示

理解了信息的本質,我們就能以不同視角看待一些問題:

1. 為什麼大模型會 " 胡說八道 "?

我經常強調大模型回復質量是跟用戶的提問質量密切相關的。

當它在面對高度不确定的問題時,沒有足夠的信息來降低系統的信息熵。就像你在猜數字時,如果得到的提示太少或者有誤導,也可能作出錯誤的判斷。

相比之下,提示詞技術這些都是輔助減少信息噪聲的方法,核心只有一個,就是讓用戶如何清晰準确的表達問題。

2. " 冗餘 " 的必要性

在信息傳遞過程中,噪聲是不可避免的。就像在電話裡說話,可能會遇到信号不好、背景音嘈雜等情況。這時候,如果信息沒有任何冗餘,一旦受到幹擾,就很難還原出原始信息了。

這個問題在内容總結類功能中其實特别明顯。很多人讓大模型總結文章時,會要求 " 只給我重點 "。結果得到的往往是一堆要點的堆砌。一旦大模型的理解有所誤解,就會導致信息失真極為嚴重。

此外,要點的堆砌雖然信息密度很高,但讀起來特别費勁。這就像把文章中的所有廢話都删掉,只留下核心觀點。表面上看起來很高效,實際上反而增加了讀者的理解成本。人類理解信息時需要上下文。那些看似冗餘的内容,比如例子、類比、過渡語句,它們就像語言中的語法結構和單詞搭配一樣,能夠幫助我們的大腦更好地處理和吸收信息。當這些必要的冗餘被去掉,即使信息都在那裡,我們也需要耗費更多精力去理解和連接它們。

3. 信息獲取策略

說到如何提高信息獲取效率,我的策略很簡單:不主動刷新聞。

因為有價值的信息會自然傳遞。重要的事情總會通過各種渠道傳到你耳朵裡。即使你不主動去搜集,該知道的總會知道。反而是那些不重要的信息,如果你不去主動獲取,它們就會自然消失。

現在 AI 領網域每天都在爆出新模型、新突破。但仔細觀察就會發現,真正的突破性進展很少,大部分都是正常的科學研究。對于并不需要專注于科研的人來說,沒有必要去刷那麼多新聞。

那些真正重要的突破,必然會在多個渠道反復出現,而且會持續發酵。就像 GPT-4 的發布,它帶來的不僅是一個新聞,而是一系列的技術讨論和應用探索。這種持續的信息流才是值得關注的。比如說這幾天的 Deepseek。

從信息論的角度看,當一個信息通過多個渠道重復出現時,不僅提高了信息的可靠性,更重要的是往往會帶來不同的視角和解讀。這些差異恰恰能幫助我們更全面地理解這個信息的價值。與其追求信息的全面,不如追求信息的深度。當你對某個領網域有足夠深的理解時,判斷一個新信息的價值往往只需要幾秒鍾。那些看似錯過的信息,很可能對你并不重要;而那些真正重要的信息,一定會以各種形式重復出現在你面前。

在信息爆炸的時代,保持定力比追求全面更重要。讓信息自然流動,而不是焦慮地追逐每一個新聞,這可能才是最高效的信息獲取策略。

4. 充滿包容的溝通

很多時候并不是對方笨,而是因為你們對信息的理解不對等。這讓我想起一個很有意思的遊戲:Tick Tock。一個雙人互動遊戲,但它不需要通過伺服器聯機:兩個玩家各自在自己的手機上玩,一個人解謎的同時,另一個人要配合完成某些操作。但關鍵是兩個人并不能看到對方的視角,只能通過其中一方的描述,來讓雙方理清處境和需求。

這個遊戲完美地诠釋了信息不對等的本質。當我們覺得 " 其他人怎麼這麼笨 " 的時候,往往不是對方真的笨,而是我們站在已知信息的角度,忽略了對方的信息盲點。就像在遊戲中,如果沒有跟對方描述清楚你的畫面,他就沒法給予你幫助。遊戲也就永遠無法推進。

我們經常吐槽用戶使用軟體的時候總是 " 不按套路出牌 "。但換個角度想,這不是用戶的問題,而是我們在設計時,沒有考慮到用戶的信息認知水平。我們覺得理所當然的操作流程,對用戶來說可能充滿了不确定性。

其實大模型的使用就是一個很好的證據。它就像一個沒有說明書的產品,即使開發者也不能完全了解它。作為使用者,我們也在不斷摸索,各種提示詞技術都是試出來的。從更高維度看,我們所有人都是愚蠢的用戶。

所以,好的溝通不是簡單地傳遞信息,而是要考慮:對方當前的信息狀态是什麼,如何通過适當的信息冗餘來确保理解,以及如何建立反饋機制,驗證信息是否被正确接收。

有時候,我們需要的可能不是更多的解釋,而是更多的包容。畢竟,在信息不對等的世界裡,我們每個人都在靠着自己的認知摸索前行。

本文來自微信公眾号:阿茶的 AI 之路,作者:起名賊費勁的阿茶

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們