今天小編分享的科技經驗:《西遊記》把大模型給難倒了,歡迎閱讀。
衡宇 發自 凹非寺
量子位 | 公眾号 QbitAI
問:《西遊記》裡,總共提到過孫悟空這只猴多少次?
咱問了問 ChatGPT,ChatGPT 連連搖頭,說《西遊記》篇幅太長,它統計不出來。
不死心,又把這個問題問向了 Claude。
Claude 頻頻擺手,說因為不具備完整閱讀和分析長篇文學作品的能力,無法統計。
事實上,不僅僅是 ChatGPT 和 Claude 答不上來,市面上的大模型幾乎都無法(準确)回答這個問題。
除了《西遊記》作為章回體小說,本身篇幅太長外," 孫悟空 " 還在書裡有各種各樣的代詞指代,比如大聖、孫行者、美猴王、心猿、甚至是你 / 我 / 他……
于是,大模型們在這道題面前只能束手就擒。
然而,對于任何一名人類傳統程式員來說,這壓根不算一個難題,只要用編程、邏輯推理去解決,确定的答案很容易擺在眼前。
但如果非要把解決方式切回 " 大模型 " 模式,幻覺和精度,就是最直接的問題。
一家國内的 AI 創業公司給出了它們的答案:選擇做個人 AI 計算機,用它補齊大模型和 AI 應用間缺失的那一環。
嘗試統一神經網路和高級編程語言
這家公司名為 KMind,創始人吳翰清,他更為業内人士所熟知的身份是阿裡雲的道哥 / 小黑,是前阿裡雲首席安全科學家、P10 級研究員。
去年 5 月離職阿裡後,他和阿裡前同事陳冬白攜手創業,又邀請來西湖大學 AutoLab(自主智能實驗室)負責人于開丞擔任首席科學家,KMind 的核心團隊就這麼搭建起來了。
在去年 7 月,KMind 曾推出過一款面向 C 端用戶的 AIGC 效率工具。
7 月份推出,不到 3 個月時間,這款 AIGC 效率工具已經擁有了 10 萬用戶。
但困境伴随而生:用戶流失率非常高。
吳翰清最終思考出的結論是,沒有人喜歡一個滿嘴謊話、不懂裝懂的人,尤其是那些從未接觸過 AI、不知 AI 為何物的用戶,第一次用上 AIGC 效率工具,往往會把對方當成一個在和自己交流的真實的人。
這樣就會導致用戶一旦發現 AI 不靠譜,就會氣到當場棄用。
" 目前 LLM 在解決幻覺問題上主要還是靠對齊,但這類技術治标不治本。要想徹底解決這個問題,我認為還得從 LLM 之外尋求答案。"
當然," 幻覺 " 僅僅是大模型存在的最大問題之一,另一個問題,也是大模型無法準确回答西遊記裡有多少孫悟空的另一個原因,是書中指代孫悟空的名詞、代詞太多,大模型目前的推理能力還無法進行精準判斷。
" 對于所有的程式員來說,邏輯推理都不是一個問題,1+1 必然等于 2。" 正如吳翰清所說," 但是對于所有做神經網絡的人來說,如何讓神經網絡自動生成 1+1=2 這個答案并不容易。"
基于這一點,KMind 團隊的思考逐漸清晰:
不如試試,統一神經網絡和高級編程語言。
神經網絡主要提供泛化能力,高級編程語言則提供邏輯推理能力和精準控制能力,兩者連接起來,雙管齊下,就能解決大部分問題。
提出 " 個人 AI 計算機 "
沿着這個思路提出一種具體的解決辦法,就是 KMind 所提出的造一個擁有新型計算機作業系統 kOS 的 " 個人 AI 計算機 "。
先簡單了解一下,什麼是個人 AI 計算機。
一起來看個人 AI 計算機長啥樣:
在這個架構中,依次有輸入輸出、記憶器、控制器、運算器和存儲器。
其中,控制器相當于整個系統的 " 大腦 ",是真正理解用戶意圖、并對復雜任務進行拆解,以及調度不同執行單元來完成用戶任務的部分。
在這個部分裡,為了模拟人的思考過程,又存在評估器和決策器。
與此同時,控制器還會不斷和外界進行互動,通過多輪對話等方式,需要用戶不斷提供新的信息,形成反饋,然後整個系統不斷進行迭代、循環。
而個人 AI 計算機作為 kOS 的實現目标而存在,被稱為計算機,是因為它符合馮 · 諾伊曼架構,從設計之初,就符合信息論、控制論和系統論的結合。
首先,從系統論角度來說,kOS 在追尋對神經網絡和高級編程語言兩者的統一;
其次,公布出的架構裡,kOS 有模拟人類思考的過程,符合控制論的設計思想;
再者,kOS 滿足信息論則體現在架構能夠通過數據脫水和數據浸泡產生結構化數據。
這裡多提兩句,數據脫水和浸泡也是 KMind 提出的新概念。
繼續用《西遊記》來舉例子。數據脫水,就是把整本書先進行數據挖掘,生成結構化數據——這個過程本身就調用了多次計算,且計算可能來自于小模型,也可能來自于大模型。
產生結構化數據後,就可以根據用戶的邏輯或需求,在任意尺度上對其進行精确控制,随意替換掉需要部分的 " 零件 "。
脫水後的結構化數據去除掉了冗餘信息,最終以一個跟信息熵相關的指标,來衡量 AI 操作數據的精确程度。
修改後的結構化數據會被評估 " 是否對原有數據造成了破壞 ",如被破壞,則在 AI 精度上繼續迭代修改。最後将數據還原,或生成為用戶可讀的數據形态。
能解決什麼問題?
對精确部分進行修改,就像 AI 繪畫過程中,利用 ControlNet 插件精确控制手部區網域進行修改,直到滿意,再也不用整體推翻重新再來了。
如此這般,大模型的幻覺和精度問題,至少能在現在得到緩解。
這也是個人 AI 計算機為自己賦予的使命之一。
" 之一 " 意味着它的作用并不全在此。
個人 AI 計算機被視為一個全新概念,是因為它的目标是把個人電腦 " 小型化、普惠化,讓每個人都用得起 "。
這與現在的個人電腦迥乎不同:在此之前,互聯網把一個個個人電腦連接在一起,全球的數字化信息由此可以在互聯網裡高速流動。
但信息匯集,產生了超級節點,數據也漸漸被互聯網巨頭壟斷。
在 KMind 團隊看來,這十分不合理,用戶貢獻了數據,但數據壟斷後的收益都是互聯網寡頭的;數據壟斷還會進一步帶來互聯網的割裂,不僅降低用戶體驗,還違背了互聯網互聯、自由的屬性。
因此,個人 AI 計算機一方面想解決大模型不能解決之痛,另一方面,還希望能解決由于信息聚集在 Google 這樣的超級節點導致的數據壟斷、互聯網割裂等問題。
開啟這個目标的第一步,KMind 就表示自己的商業模式不會是通過廣告業務實現。
如果這個公司的商業模式是廣告,很難避免自己不作惡。
同時,團隊也明确表示不會拿用戶的數據訓練自己的模型,也不會将屬于每個用戶的數據綜合後形成一個通識 AI。
在團隊規劃中,KMind 的商業模式是這樣的:
KMind 提供算力,程式員用戶提供算法,用戶提供數據,且數據永遠歸用戶擁有。
吳翰清強調,這是一個良性的生态結構,他同時也強調,個人 AI 計算機裡的推薦和檢索算法都會被開源,并由一個開源社區來維護。
" 如果有一天半個宇宙居然想要把這些閉源掉,那我也号召所有半個宇宙的居民來推翻它,因為從那一天可能就是它作惡的開始,它又開始從嘗試不壟斷數據走向了數據壟斷。"
One More Thing
現在,KMind 已推出了由 kOS 驅動的個人智能助理 " 星伴 "。
每個用戶和星伴将是伴生關系,按照用戶的意圖,星伴會為自動為用戶工作,或陪用戶聊天。
和其他可調用 AI 不同,星伴是可編程的,具備成長性,它所經歷的個性化知識、經驗、記憶、性格會被保存在一個叫 " 星魂 " 的地方,最終形成屬于每個人的數字資產。
一旦經過允許,你可以調用其他人星伴裡的知識,最終形成一個龐大的 AI 社區。
也因為星伴的存在,人的在線時間不再受制于睡眠和休息,AI 會幫你時刻在線,只要提供了數據,AI 就能開放式的回答所有問題,永不停歇的服務、溝通、協同。
想想有點激動,感覺有了星伴,本打工人的摸魚時間一定能更多了吧……(doge)。