今天小編分享的财經經驗:從信息論的視角,重新認識這個世界,歡迎閲讀。
本文來自微信公眾号:阿茶的 AI 之路,作者:起名賊費勁的阿茶,題圖來自:AI 生成
那天中午,我在知乎上看到一個有趣的問題:
把一篇英語文章的所有 aeiou 替換成 t,它還有可能被完全破譯嗎?
我翻閲了許多回答,有的列舉了 tt、ttt、tttt... 這樣的例子、有的則一本正經地胡説八道、還有人幹脆把問題丢給大模型解決 ....
我覺得這本質上是一個信息論的問題。當我們把所有元音替換成 't' 後,剩餘的信息是否足夠支撐我們還原原文?英語本身就有很高的冗餘性,比如語法結構、詞語搭配等都能提供大量上下文信息。因此,在長文本中,這種還原應該是可行的。關鍵在于,這種替換究竟損失了多少有效信息,剩下的部分是否還足以支撐我們的理解和還原。
説到信息論,我與它的聯系大概是大學選過的一門課,叫《多媒體技術》。選課之前,我天真地以為這門課會教我如何用 PS,如何剪視頻,如何做 PPT。因為從小就在説的 " 多媒體教育 ",感覺就是通過 ppt 來上課。還有 " 多媒體教室 ",就是多了個投影,所以我一直以為這就是 " 多媒體 "。我選它的原因也很簡單,我真的不會用 PS,我想學學。而且這門課應該比較簡單。
上課之後:奈奎斯特定理、信息熵、zigzag、JPEG 影像壓縮原理 ...
我以為的課設:剪一個視頻。
實際上的課設:
就這麼一門和我想象大相徑庭的課,我現在卻覺得是我學過最有用的一門課。因為 " 信息 " 無處不在。你看的新聞是信息,你與他人的交流是信息,甚至你設計的產品界面也在給用户傳遞信息。
尤其是在當下,信息生產的成本急劇降低,各種公眾号 ... 一個事件可能會被上百個号重復報道。此外,AI 領網域的進展也是日新月異。相比之下,我們就像大海中的小船,随時可能被信息淹沒。接受吧,腦子好像又處理不過來;不接受吧,又怕錯過了什麼。而信息論,正是幫助我們找到理解這些信息的角度,以及制定獲取信息策略的工具。
説遠了,我去簡單復習了一下信息論的基礎知識,也分享給大家。
從生活中理解信息
最開始寫這篇文章的時候,我從定義和公式的角度介紹信息、信息熵、自信息這些概念 ... 但發現太專業了,不适合閲讀。所以我打算放棄那些專業的知識,從一個簡單的遊戲理解信息論。這種直觀理解對于非專業人士來説更為重要。
首先,信息是消除不确定性的。
假設我心裏想了一個 1 到 100 的數字,請你來猜。在沒有任何提示的情況下,這就是一個完全不确定的系統 —— 每個數字的可能性都是相等的。
如果我告訴你:" 今天天氣不錯,我覺得等會我們可以出去玩,順便去吃個火鍋 "。
這句話你會發現對你猜測毫無作用。
而如果我告訴你:" 這個數字大于 50"。你的猜測範圍就減少了一半,然後你猜了個 75。
我繼續説:" 這個數字的範圍在 60-70 之間 "。你的猜測範圍進一步縮小,你猜了個 63。
我説:" 猜對了!"
通過這個簡單的遊戲,我們就能理解信息論中的幾個核心概念:
首先,根據信息論中的定義,信息是用來消除不确定性的。你試圖猜我心中想的數字,通過不斷的嘗試,來降低這個不确定性。直到你猜到我所想的。
自信息:單個事件發生時帶來的信息量。這裏的事件指的是我給你的提示。其中 " 這個數字是 73" 這個事件的自信息就很大,因為它的發生概率很小(1/100)。
信息熵:系統的平均不确定性,當你完全不知道我内心所想的時候,信息熵達到最大。
信息增益:獲得這個信息後,系統不确定性減少的程度。它實際上是信息熵的變化量:原來的信息熵 減去獲得信息後的信息熵。在這個對話中,"60-70 之間 " 能帶來的信息增益一定大于 " 大于 50",因為它幫你排除了更多的幹擾。你只需要在 10 個數裏面選一個。而不是 50 個數。如果我直接告訴你這個數字是 63,那麼它會将整個遊戲的信息熵降為 0。因為你已經不需要猜了。
這就是信息的本質:消除不确定性。當你獲得的有效信息越多,系統的信息熵就越小,你就越接近信源。
再舉個生活中的例子。當你在考慮是否購買一件商品時,每條信息都在幫你消除不确定性:
" 這是一件純棉 T 恤 "(确定了品類和材質)
" 價格 299 元 "(确定了價格區間)
" 隔壁店同款 199 元 "(這個信息增益很大,可能直接影響你的決策)
很明顯,這些概念不僅存在于理論中,更與我們的日常生活密切相關。每當我們需要做決策時,都在不斷地收集信息,評估信息的價值,通過獲取高信息增益的内容來幫助我們作出更好的選擇。希望這兩個例子能夠讓你有一個直觀的印象。
現在我們再來看看開頭的問題,用剛學到的信息論概念來分析一下。當我們把所有元音都替換成 't' 時,表面上看是損失了一些信息。但英語文本中其實存在大量的 " 信息冗餘 "。比如語法結構(主謂賓的位置)、單詞搭配(即使 "make a decision" 中的元音被替換,我們也大概能猜出來),以及整句話的語境,這些都在幫我們消除不确定性。即使失去了元音信息,其他信息的存在依然能幫助我們很大程度推測出原文。當然,這説的是大部分場景,信息越多,能還原成功的概率越高。
信息論給我們的啓示
理解了信息的本質,我們就能以不同視角看待一些問題:
1. 為什麼大模型會 " 胡説八道 "?
我經常強調大模型回復質量是跟用户的提問質量密切相關的。
當它在面對高度不确定的問題時,沒有足夠的信息來降低系統的信息熵。就像你在猜數字時,如果得到的提示太少或者有誤導,也可能作出錯誤的判斷。
相比之下,提示詞技術這些都是輔助減少信息噪聲的方法,核心只有一個,就是讓用户如何清晰準确的表達問題。
2. " 冗餘 " 的必要性
在信息傳遞過程中,噪聲是不可避免的。就像在電話裏説話,可能會遇到信号不好、背景音嘈雜等情況。這時候,如果信息沒有任何冗餘,一旦受到幹擾,就很難還原出原始信息了。
這個問題在内容總結類功能中其實特别明顯。很多人讓大模型總結文章時,會要求 " 只給我重點 "。結果得到的往往是一堆要點的堆砌。一旦大模型的理解有所誤解,就會導致信息失真極為嚴重。
此外,要點的堆砌雖然信息密度很高,但讀起來特别費勁。這就像把文章中的所有廢話都删掉,只留下核心觀點。表面上看起來很高效,實際上反而增加了讀者的理解成本。人類理解信息時需要上下文。那些看似冗餘的内容,比如例子、類比、過渡語句,它們就像語言中的語法結構和單詞搭配一樣,能夠幫助我們的大腦更好地處理和吸收信息。當這些必要的冗餘被去掉,即使信息都在那裏,我們也需要耗費更多精力去理解和連接它們。
3. 信息獲取策略
説到如何提高信息獲取效率,我的策略很簡單:不主動刷新聞。
因為有價值的信息會自然傳遞。重要的事情總會通過各種渠道傳到你耳朵裏。即使你不主動去搜集,該知道的總會知道。反而是那些不重要的信息,如果你不去主動獲取,它們就會自然消失。
現在 AI 領網域每天都在爆出新模型、新突破。但仔細觀察就會發現,真正的突破性進展很少,大部分都是正常的科學研究。對于并不需要專注于科研的人來説,沒有必要去刷那麼多新聞。
那些真正重要的突破,必然會在多個渠道反復出現,而且會持續發酵。就像 GPT-4 的發布,它帶來的不僅是一個新聞,而是一系列的技術讨論和應用探索。這種持續的信息流才是值得關注的。比如説這幾天的 Deepseek。
從信息論的角度看,當一個信息通過多個渠道重復出現時,不僅提高了信息的可靠性,更重要的是往往會帶來不同的視角和解讀。這些差異恰恰能幫助我們更全面地理解這個信息的價值。與其追求信息的全面,不如追求信息的深度。當你對某個領網域有足夠深的理解時,判斷一個新信息的價值往往只需要幾秒鍾。那些看似錯過的信息,很可能對你并不重要;而那些真正重要的信息,一定會以各種形式重復出現在你面前。
在信息爆炸的時代,保持定力比追求全面更重要。讓信息自然流動,而不是焦慮地追逐每一個新聞,這可能才是最高效的信息獲取策略。
4. 充滿包容的溝通
很多時候并不是對方笨,而是因為你們對信息的理解不對等。這讓我想起一個很有意思的遊戲:Tick Tock。一個雙人互動遊戲,但它不需要通過伺服器聯機:兩個玩家各自在自己的手機上玩,一個人解謎的同時,另一個人要配合完成某些操作。但關鍵是兩個人并不能看到對方的視角,只能通過其中一方的描述,來讓雙方理清處境和需求。
這個遊戲完美地诠釋了信息不對等的本質。當我們覺得 " 其他人怎麼這麼笨 " 的時候,往往不是對方真的笨,而是我們站在已知信息的角度,忽略了對方的信息盲點。就像在遊戲中,如果沒有跟對方描述清楚你的畫面,他就沒法給予你幫助。遊戲也就永遠無法推進。
我們經常吐槽用户使用軟體的時候總是 " 不按套路出牌 "。但換個角度想,這不是用户的問題,而是我們在設計時,沒有考慮到用户的信息認知水平。我們覺得理所當然的操作流程,對用户來説可能充滿了不确定性。
其實大模型的使用就是一個很好的證據。它就像一個沒有説明書的產品,即使開發者也不能完全了解它。作為使用者,我們也在不斷摸索,各種提示詞技術都是試出來的。從更高維度看,我們所有人都是愚蠢的用户。
所以,好的溝通不是簡單地傳遞信息,而是要考慮:對方當前的信息狀态是什麼,如何通過适當的信息冗餘來确保理解,以及如何建立反饋機制,驗證信息是否被正确接收。
有時候,我們需要的可能不是更多的解釋,而是更多的包容。畢竟,在信息不對等的世界裏,我們每個人都在靠着自己的認知摸索前行。
本文來自微信公眾号:阿茶的 AI 之路,作者:起名賊費勁的阿茶