谷歌Bard整頓AI“亂說”，數學運算能力提升30%，支持表格導入

今天小編分享的科技經驗：谷歌Bard整頓AI“亂說”，數學運算能力提升30%，支持表格導入，歡迎閱讀。

智東西（公眾号：zhidxcom）

編譯 | Glu

編輯 | 李水青

智東西 6 月 13 日消息，當地時間 6 月 7 日，科技巨頭谷歌公司對其 AI 聊天機器人 Bard 進行了更新，提升了機器人邏輯與推理能力，并增加了表格的導出形式。

Bard 是谷歌公司為了對抗 ChatGPT 和 BingChat，在今年 3 月 21 日正式推出的一款聊天機器人。此次更新是谷歌繼 5 月新增 Bard 圖片回復功能後的又一次功能迭代，主要針對 Bard 的數學計算能力，預計能将 Bard 解決數學問題的能力提高 30%。

一、結果的生成：不只靠預測，加入計算力

Bard 這次的具體更新内容包括兩個方面：

1、提升在數學計算、編碼問題和字元串操作方面的能力；

2、提供了一個 " 到谷歌表格 " 的新導出選項。有了這個新功能，用戶可以将 Bard 在其回答中創建的表格直接導出到表格中。

在第一項更新中，Bard 使用了一種名為" 隐式代碼執行（implicit code execution）"的新技術，它可以讓 Bard 編寫和執行自己的代碼。最新版本的 Bard 識别能根據邏輯代碼的提示，在後台編寫代碼、對其進行測試，并使用結果來生成更準确的回答。

這大大提高了 Bard 的推理和數學能力，使其有能力解決高級推理和邏輯性較強的復雜問題。如：

15683615 的質因數是什麼？

計算某人儲蓄的增長率

倒寫單詞 "Lollipop"

▲ Bard 對倒寫單詞 "Lollipop" 的回復

Bard 之前所使用的 LLM（大語言模型）像是一個預測引擎。LLM 根據提示，來預測可能進一步出現的詞匯，進而生產回復，整個流程并不涉及精細的邏輯推理與計算。因此，他們有能力解決語言類、創造性任務，但卻無法準确回答推理、數學等領網域的問題。

二、結合大模型與傳統代碼，準确度提高 30%

這項技術的靈感來源是二分法，特别是丹尼爾 · 卡尼曼（Daniel Kahneman）的雙系統思維模型，他認為人的大腦存在兩個系統，并稱之為系統 1 和系統 2：

系統 1 是無意識思考，是快速的、直觀的、毫不費力的，如一個樂手在演出現場即興演奏，使用的就是系統 1 思維；

系統 2 則需要耗費精力、保持專注，是緩慢的、審慎的，如人們運用數學運算、學習專業樂器演奏時，使用的是系統 2 思維。

以此類比：

LLM 是在系統 1 思維下運作的——沒有經過深度思考，快速產生文本；

傳統代碼計算方法則與系統 2 類似——公式化、不靈活，但能產生正确的結果。

以做一道數學題為例，如果只使用系統 1，那根本不需要解題方法，直接把想到的答案寫出來就行了；但是加上系統 2 後，便可以運用加減乘除等數學方法去解題。

本次更新中，谷歌結合了 LLM（系統 1）和傳統代碼（系統 2）的能力，來幫助提高 Bard 反應的準确性。谷歌稱，在他們的内測數據集中，Bard 解決計算類問題的準确性提高了約 30%。

即使這樣，Bard 也無法保證回應的絕對準确。Bard 不會生成有助于提示響應的代碼，它生成的代碼可能是錯誤的，它也無法保證一定将執行的代碼包括在其響應中。

結語：各大廠商關注機器人邏輯性，AIGC 準确性将繼續提高

6 月 1 日，OpenAI 宣布 ChatGPT 數學解題能力将大幅提升，現在，谷歌也宣布了 Bard 的數學計算能力提高了 30%。

這向我們釋放了強烈的訊号，即 AIGC 聊天機器人行業陸續在關注着 AIGC 解決復雜問題的能力、生成内容的準确性，并不斷在以各種方式提升 AIGC 内容的結構化、邏輯性。未來，我們将享受到能力更強大、結果更準确的 AI 服務。

來源：Google 官網